信用評分:一個簡短的歷史

買、買、買!就算我們買不起,我們還是想買東西,所以我們會向其他人借錢來一了心願。這個「其他人」(不管是誰,也許是朋友,也許是銀行)有一個簡單的問題要問:「我可以相信這個借款人會還錢嗎?」

在資訊還不流通的世代裡,潛在的債權人會根據人品及外表來評估潛在的債務人,「他看起來是一位還不錯且可靠的人,我想他應該會還錢,而且他答應不但會還本金,還要付給我利息呢。」其實,幾世紀以來,街角的雜貨店老闆早就發展出一套觀察顧客是否可靠的方法,很有趣但也不會令人驚訝的是,美國最老牌信用報告公司的前身,就是雜貨店經營者。

凱托.伍爾佛德(Cator Woolford)在美國田納西州(Tennessee)查塔努加市(Chattanooga)擁有一家雜貨店,他在經營雜貨店的幾年期間,一直收集和顧客互動的資料,後來集結資料出了一本書,還把一些書賣給了當地的雜貨業者協會。有了這個初步的成功之後,他和擔任律師的弟弟蓋伊(Guy)在亞特蘭大合開了一間名為「零售業信用」(Retail Credit Company)的公司,這個小公司最後穩定成長為全美三大消費者信用報告機構之一的「艾可飛(Equifax)」公司,(其他兩家分別是「益博睿(Experian)」和「環聯(TransUnion)」),他們的業務就是蒐集並處理數達八億的個別消費者資訊。

當人們被賦予評斷他人品格或個性的工作時,他們會非常、非常的主觀。同樣的,給予或拒絕貸款以及處理貸款申請,也都是很主觀的事,伴隨年齡、性別、種族而產生的歧視都會一再的發生。以定量分析來幫助決策者,已經是向客觀邁進了一大步,目標則是要盡量消除主觀意識,也包括了因認知偏誤而引致的主觀判斷。

威廉.羅伯特.費爾(William R. Fair 1923–1996)和厄爾.艾薩克(Earl Isaac 1921–1983)兩人是建立預測潛在借貸者行為的數學模型的先驅,他們在一九五八年推出,最初版本的信貸申請信用評分計算式。這個計算式把借貸者的可能行為分成三種:準時還錢、延時還錢以及根本不還。他們隨後成立了費爾-艾薩克公司(The Fair Isaac Corporation),並且發展出一個計算式以及相關的配套軟體,用來計算後來名聞遐邇的FICO信用評分(FICOScore)。

信用評分是怎麼算出來的?結果又有多客觀?

這本書的主要目的是,要發掘出我們在主觀和客觀之間遊走的潛規則。我們不能否認(我也不想這麼做)計算式所根據的是人的假設,在做出各種假設之後,最後產生的評估就是自動程序計算的結果。要產生一個信用評分,最先要做的就是:決定要輸入什麼樣的數據,FICO信用評分考慮的因素有五個:

你支付帳單的歷史。

你的信用卡債、房屋貸款、銀行貸款⋯⋯有多少?

你的信用紀錄有多久(愈久愈好)。

你所擁有的貸款種類(愈多樣愈好)。

新的信用貸款申請(不要開太多新的帳戶或開設得太快)。

第二個(很自然的)問題是,假定前述五個因素都同等的重要,合理嗎?如果我們假定答案是肯定的,就可以把前述五個輸入變量都賦以百分之二十的比重。然而,更合理的假定是他們的重要性應該是由高而低。FICO信用基金計算式採用的是下列比重:

支付帳單的歷史:百分之三十五。

積欠的債務:百分之三十。

信用紀錄的時間:百分之十五。

信用貸款種類:百分之十。

新的信用貸款:百分之十。

我們已經知道計算信用評分時會考慮的因素,但同等重要的是,我們也要知道哪些因素不會被列入考慮。公平信貸機會法(The Equal Credit Opportunity Act)禁止美國的債權人基於種族、膚色、宗教、來源國別、性別、婚姻狀態以及年齡,對申請借款者進行歧視。

現在還有一些其他的國家也基於類似的目的(例如審查個人的信用等級以及信用程度)而採用信用評分的作法,但各國的法律環境卻各有不同,計算信用評分的方法也不少,然而更技術性的來說,信用評分(一個數字)是計算式的產品,而最簡單的方法,就是將加權過的輸入數據加總。

FICO信用評分計算所採用的尺規是從 300 到 850,但該公司對於評分是如何計算出來卻一直不甚透明。有一位部落客寫道:「『FICO信用評分』應該要公開他們那至關重要的計算式,他們的說法是不希望人們會設法去操弄它,但他們也應該要考慮信用評分在消費者買房、買車時所扮演的重要角色,不應該把它變成一個只有它們才懂得的『黑盒子』。」

隱藏在信用評分遊戲裡的潛規則

信用評分也會像許多其他的演算法一樣受到檢視,檢查它們是否隱藏而非消除某種形式的偏誤。舉世知名的偉凱律師事務所(White & Case)專家在一篇論文《演算法及其偏誤:債權人必須知道的事》(Algorithms and bias: what lenders need to know)中解釋道,就算那些單純只是跟金融科技有關的演算式,也有可能導致帶有歧視的決策,為什麼?因為債權人和放貸人在這個大數據風行的時代裡,有辦法接觸及收集到所謂的非傳統數據,譬如說個別對象在網路上的活動、購物模式以及其他並不必然跟信用度有直接關係的數據。

通常,這些數據都是用新進所流行的機器學習技術來進行分析(譯註:機器學習〔Machine Learning〕是人工智慧發展的一環,指的是讓機器「自主學習」的演算法。透過迴歸分析,機器能從一堆數據中,找出規律並做出預測,當輸入的數據愈來愈多,演算法也會持續的調整並做出更精準的分析)。

傳統演算法用的是設計者所定義的數學及邏輯法則,舉例來說,如果借貸者準時還錢了,他的信用評分就會增加幾個點。但機器學習技術卻不仰賴先前所定義好的演算式,而是根據在大數據組中,找出的模式來產生演算式。以批准借貸申請案例來說,相關軟體會儲存並分析數以千計先前申請借貸顧客的相關財務行為,然後把新申請者的過往信用歷史資料輸入,軟體內的機器學習演算式就會根據從先前所儲存資料所得到的行為模式,來處理新申請者的數據,進而經過計算,而將譬如說申請者是否有可能拖欠或賴帳的結果輸出。

對於演算式可能會做出歧視決定的關切不是沒有道理,特別是那些已經受到邊緣化的族群。理想的狀態下,在對一位申請借貸者做信用評估時,出借方應當只能考慮公平信貸法中所允許的數據及資料,然而我們是活在一個被鄰居、朋友以及同儕圍繞的網路世界裡,所以,如果債權的一方有辦法透過社交網路上的訊息,分析你的朋友對你的信用度評估,就有可能是採用了債權方本不應該獲得及使用的數據,結果卻是不經意的做出有歧視性的決定。

住家地址也可能是一個重要的因素。這是由於美國的許多城市都曾經實施過社區隔離的所謂「紅線(Redlining,編按:一九三五年,羅斯福政府在美國許多都市繪製「居住安全地圖」,依據種族、弱勢人口比例及信用評分,來劃設紅、黃、藍、綠等不同顏色分區,代表抵押借錢給不同分區居民的風險程度)」政策,所以郵遞區號也是一個帶有歧視危險性的變數。

機器學習演算式也許會找出你的信用度,和你的朋友或鄰居的理財行為之間的關係。這是一個相當複雜的情況:債權人不能因為你的朋友很多都不準時還錢而拒絕你的借貸要求,另外,他們也應該要能解釋不同意出借的理由,但如果所採用的是非傳統數據,就很難做到透明及解釋得清楚。

現在應該已經很清楚了,就是你的社群網路資料不能被用來評估你的財務需求,然而我們確實也會仰賴推薦系統來決定自己要做什麼,譬如說選擇旅館、餐廳、交友約會、觀賞電影(這個清單並無排序)等。推薦的演算式使用的是與「我的朋友所喜愛事物」相關的數據來產生你的品味預測,我們將在第八章中就這一部分進一步討論。

我們應該喜歡演算式嗎?如果你已經準備回答「不」,難道回到那種主觀性極強,根據人的個性來評估信用度的方法會更好嗎?金融科技的發展不斷的挑戰過去發放貸款的傳統標準。二○一六年五月,美國財政部發表名為《線上市場借貸的機會與挑戰》(Opportunities and Challenges in Online Marketplace Lending)的報告。除了市場上那些傳統的業者,網上市場借貸公司的出現,為消費者及小生意人提供了更快速的借貸。財政部體認到這個新型信貸體系的重要性,同時對其所提供的機會及風險進行分析,對消費大眾而言,當然是個好事。

演算法有可能公平嗎?

電腦學家已經了解到演算法可能會不經意間導致歧視。資料探勘(Data-Mining)的方法源自於現代科學的先驅,例如:義大利物理學家伽利略(Galileo)、德國天文學家、數學家與占星家克卜勒(Kepler)以及英格蘭物理學家、數學家、天文學家牛頓(Newton),他們都是提出檢視過去可以預測未來的先行者。這個方法在預測行星的運行方面很有用處,那麼,我們是否也可以假設,關於社群行為的歷史數據,也可用來做為預測未來的基礎?

現在已經有根據歷史數據來預測犯罪行為的演算法,它們根據例如一天中的什麼時間、季節、天氣狀況、地緣關係(例如酒吧、公車站等)、過去的犯罪水準以及類似的數據來進行演算,幫助警察部門有效分配資源來進行犯罪預防的工作。預測性警察活動(Predictive Policing)當然也標榜種族中立以及客觀,但這個運算方法的應用,還是引起對一些新問題出現的關切,這些問題有關於安全性、個人隱私以及公民的憲法權利。我們不得不再說一次:預測性警察活動的演算——其實經常發生——固然有助於執法者分配資源,但卻並非消除犯罪的萬靈丹,也會帶來意想不到的後果。

一位現在任教於芬蘭赫爾辛基大學(University of Helsinki)名為英德麗.澤里奧巴提(Indrė Žliobait )的立陶宛數據科學家在一份有關《機器學習公平意識》的意見書中寫道:「通常,預測的模型都會被優化為,在大多數案例中可以良好運作的狀態,不會去考慮有什麼會受到其餘不準確因素的嚴重影響。」我們都知道數字的背後還是有人的因素,而這個現象確實會帶來困難的情況與嚴重的關切。

我想,我們都知道那些原先設計為中性的演算法,後來卻造成性別歧視或種族歧視的可怕故事,我也不想在這裡重複。造成前述現象的一個原因就是:機器從數據中的例子進行學習,而數據卻是來自於人,會反映出人的偏誤。所以,演算法是有可能維持甚至放大偏見以及社群的階級意識。

社會科學家和電腦科學家應該攜手合作,設法創造出「道德性演算法(Ethical Algorithm)」。道德作為一種紀律,可以用來辨別「好行為」或「壞行為」的組成(哲學家會給我們答案)。從機器學習的觀點來說,關鍵在於如何「訓練」演算法做道德決策,以便數據能經過前置處理,並且剔除那些不符合道德標準的部分。我們也許可以期待,未來會有許多目的在於,了解建立道德性演算法的限制以及其範圍的研究工作。我們也應該接受,在這個領域裡所謂的「公平」,還沒有一個明確及完善的定義。

演算法以外:借貸圈以及信用評分遊戲

會學習的可不只是演算法而已,人也會學習。亞利桑納大學(University of Arizona)的一位研究員馬克.基爾(Mark Kear)就針對移民學習(1)如何操弄信用評分這個遊戲,(2)如何改善他們的信用紀錄這兩方面進行了研究、分析。基爾是一個借貸圈的觀察者也是參與者。這個借貸圈是由以舊金山為基地的非營利組織「密信資產基金會」(Mission Asset Fund)主持,主要的工作是協助低收入家庭提高他們的信用評分,參與成員在這個團體中學習申報資料的策略,以求能改善自己的信用度。密信資產基金會所傳授的技巧,可以幫助參與者大幅增加其信用評分(有一個案例是增加了一百六十八點)。

不算是總結

美籍猶太數學家約翰.馮.諾伊曼(John von Neumann)在他的論文《我們挺得過科技的衝擊嗎?》(Can We Survive Technology?)中寫道:

所有的經驗都告訴我們,即使是比現在即將發生的事情還要小的科技變化,都會造成政治及社會關係的深遠轉變。經驗也告訴我們,這些轉變並非事前可以預測,而且大多數當代的相關「初估值」也都是錯的。因此之故,人們無須太嚴重看待當前所遭逢的困難,以及當前所倡議的改革⋯⋯。

一個確鑿的事實是,困難是經由雖然有用及有建設性但卻也危險的演化而來。我們能夠及時創造出所需要的調適嗎?最能讓人保持希望的答案是,人類先前就受過類似的試煉,因此有與生俱來的能力熬過那些程度不一的麻煩事。事前就要求一個完整的應對方法是不合理的,我們只能指出所需要的人類素質:耐心、彈性以及智慧。

這裡習得的教訓:為什麼度量社會是那麼困難?(但並非無望)

做出客觀的排名似乎是個很誘人的目標,然而就如我們在本章所見,至少有兩個理由使得我們也許無法做到客觀:無知愚昧和操弄控制。就像我們現在常常可以看到,由於社會心理學中所稱的鄧寧-克魯格效應,無能的人經常會高估自己。

社會中無所不在的,除了無知愚昧之外還有操弄控制。度量的程序在任何文明中,都扮演了主要的角色。根據實證主義(Positivism)的樂觀前景,度量是造成改善的第一步。社會對於問責及透明度的需求,讓定量指標成為衡量社會機構績效的一個主要工具,然而,坎貝爾定律也是指標會(而且經常是如此)受到操弄的一個警訊。

演算法是「排序及拔除」的主要支柱,信用評分則是這種機制會放大社會不平等的最佳範例。然而,我們也不應該就因此而放棄演算法,去選擇原先那種具有主觀性的口頭評估。社會科學家和電腦科學家應該攜手合作,去創造出「道德演算法」。

現在,讀者應該已經熟悉了我們都在玩的排名遊戲的可能性及困難度。我們將在下一章中討論這個遊戲的兩個主要案例:大學排名及國家排名。

