《風險之書》:常態分配的巧妙平衡,讓他更加肯定「平均人」正確無誤

《風險之書》:常態分配的巧妙平衡,讓他更加肯定「平均人」正確無誤
Photo Credit: Shutterstock/達志影像
我們想讓你知道的是

凱特爾對常態分配太過著迷,以致確認了不該確認的事。不過,他的研究在當時影響廣大,後來著名的數學家兼經濟學家艾吉渥茲(Francis Ysidro Edgeworth),就發明了一個字「凱特爾兮兮」(Quetelismus),以形容學術界日益氾濫的在根本不存在常態分配之處,或不符真正常態分配的條件時,宣稱發現常態分配。

唸給你聽
powered by Cyberon

文:彼得.伯恩斯坦(Peter L. Bernstein)

「平均人」觸動大眾想像

這本書不是只有枯燥無味的統計學和字斟句酌的正文而已,書中主角「平均人」(average man)一直活到今天。觸動了大眾的想像,更加提升凱特爾的聲望。

凱特爾致力界定「平均人」的特徵,使他成為他出身的特定團體的代表,不論這團體是罪犯、酒鬼、軍人、死者。凱特爾甚至假設,「如果任一時代、社會裡一個具備所有平均人特徵的人,就足以代表一切的偉大、善或美。」

不見得每個人都同意這種論調。批評凱特爾這本著作最激烈的庫爾諾(Antoine-Augustin Cournot),是位知名的數學家兼經濟學家,也是機率權威。庫爾諾堅持,非得遵守機率的規則,「才會對科學觀察中所做計量的精確度……或商業投機成功的條件有清楚的概念。」庫爾諾大加嘲弄平均人的觀念。他說,把許多直角三角形的各邊平均後,結果就不再是個直角三角形,完全符合平均的人,也不再是個人,而是個怪物。

凱特爾不為所動。他確信年齡、職業、地點、種族,都可以找到平均人。甚者,他宣稱有辦法預測為什麼某人會屬於某團體,而非另一個團體。這是個嶄新的方向,到這時為止,還沒有人敢用數學和統計學區分事情的因果。凱特爾寫道:「果對應因成正比。」然後他特別強調的指出:「接受觀察的個體數量愈多,生理與道德上的個別特徵就愈被泯滅,使一般性的條件更加彰顯,而社會就生存在這樣的基礎上。」一八三六年,凱特爾將這些觀念擴充,成為一本探討如何將機率應用於道德與政治的書。

凱特爾的因果研究讀來引人入勝。例如,他用大量篇幅分析,哪些因素會使刑案的被告獲判有罪的比率升高。在所有的被告中,平均六一.四%被判有罪,但如果犯行對象是「人」,被判罪的機率低於五○%,而如果犯行是針對財產,被判罪的機會就超過六○%。如果被告是個三十歲以上、受過教育的婦女,且自動自發出庭受審,被判罪的機會就低於六一.四%。凱特爾也試圖確定,偏離平均值六一.四%的誤差,究竟是具有顯著意義或隨機出現:他在懲戒不道德的審判中,找尋近乎精準的確定性。

凱特爾放眼所及都是鐘形曲線。幾乎在所有的情況下,相對於平均值的偏差都乖乖遵守拉普拉斯與高斯的預測──呈對稱分配於平均值兩側。這個以平均值為頂點的巧妙平衡,使凱特爾更加肯定,他鍾愛的「平均人」觀念正確無誤。他的統計學研究所有的推論都以此為基礎。

例如在一項實驗中,凱特爾量了五千七百三十八名蘇格蘭士兵的胸圍。他先算出這群人的常態分配,然後用實際度量的結果跟理論值比較。兩者幾乎完全一致。

偏差純屬隨機

高斯的常態分配在自然界無所不在,已經獲得證明,現在看來,也存在於社會結構和人類的體能特徵之中。因此,凱特爾下結論道,從蘇格蘭士兵的極端符合常態分配,可見相對於平均值的偏差純屬隨機現象,而非源自這個團體內部有系統的差異。換言之,這個團體本質上非常平均,一名平均的蘇格蘭士兵足以代表所有的蘇格蘭士兵。再怎麼樣善變,埃及豔后還是一個女人。

但凱特爾有一項研究卻非常嚴重的偏離常態分配。他分析十萬名徵召入伍的法國士兵,發現他們大都身材偏矮,以致不符合常態分配。但由於個子矮是豁免兵役的好藉口,他猜測是有人為了逃避兵役,從中竄改數據。

庫爾諾則一口咬定平均人是怪物,由此可見,他對於機率逾越自然範疇,應用於社會性數據頗有反感。他認為人類可有無數種分類方式。但凱特爾相信,從度量人類得到的常態分配可知,他檢驗的人類樣本中,差異均為隨機性──但庫爾諾不同意:「以任一年新生男嬰人數的分類方式為例:父母的年齡、地理位置、星期中的哪一天、種族、體重、懷孕的時間長短、眼睛的顏色、中指的長度,都可做分類的標準,以上不過是少數例子。那你怎麼能有十足把握的說,哪個嬰兒是平均嬰兒呢?」庫爾諾聲稱,根本沒法子決定哪種數據有意義,而其他數據純屬偶然:「同樣大小的偏差,可以有許多種解讀方式。」但庫爾諾沒提到一件現代統計學家熟知的事實,人體的度量大都反映營養上的差異,換句話說,這也就反映了社會地位的差異。

今天的統計學家把引起庫爾諾反感的那種方法叫作「資料探勘」(data mining)。他們認為,只要把數字折騰得夠久,數字就能證明任何你想證明的東西。庫爾諾認為,凱特爾從有限的觀察推出如此廣泛的結論,立足點岌岌可危。觀察一個同樣規模的團體,所得出的第二套數據就可能顯現跟前次截然不同的模式。

凱特爾對常態分配太過著迷,以致確認了不該確認的事。不過,他的研究在當時影響廣大,後來著名的數學家兼經濟學家艾吉渥茲(Francis Ysidro Edgeworth),就發明了一個字「凱特爾兮兮」(Quetelismus),以形容學術界日益氾濫的在根本不存在常態分配之處,或不符真正常態分配的條件時,宣稱發現常態分配。

尋求差異而非同質性

一八六三年高爾頓第一次讀到凱特爾的著作,就留下深刻的印象。他寫道:「平均不過是單一現象,但如果加上另一個事實,就帶出一個跟已觀察到的現象相通的常態規畫存在的可能。有人聽到統計學一詞就避之唯恐不及,可是我覺得統計學富有美感與趣味。」

高爾頓對於凱特爾所謂常態分配無所不在,尤其適用於身高與胸圍,感到十分興奮。高爾頓自己就發現,七千六百三十四名劍橋學生的數學期末考成績,從最高分到「不知多低」的分數,呈鐘形曲線分布。他更發現山德斯特(Sandhurst)皇家軍事學院入學考試的成績,也出現類似的模式。

高爾頓對鐘形曲線最感興趣的一點,就是它顯示某些數據屬於同一類,應該視為一個整體加以分析。反過來也是如此:沒有常態分配就代表「不同系統」。高爾頓強調:「這個假設沒有出過錯。」

但高爾頓追逐的不是同質性,而是差異──是埃及豔后,不是女人。探討他獨創的優生學新領域時,他甚至在特徵符合常態分配的團體中尋求差異。他的目標是把人依照「天賦才能」分類,說得更清楚點就是:「……鼓勵人向上,使他做出偉大事蹟的智力與氣質特徵……我指的是一種靠他自身的力量,在與生俱來的刺激策勵下,不斷上進,而且其力量足以使人出類拔萃的天賦……傑出的人和生來能力高人一等的人,有很多方面相同。」

高爾頓從事實著手。一八六六年到一八六九年,他蒐集大量證據,證明才華與聲望是遺傳的特質。然後他在最重要的著作《遺傳天賦》 (Hereditary Genius)(這本書附錄中討論凱特爾的著作,並對伯努利家族說話刻薄的典型性格做了尖酸的評估。)中,對自己的發現做一總結。這本書從評估高爾頓心目中的「傑出」人士在一般大眾中占有的百分比開始。以倫敦《泰晤士報》的訃聞版和一本傳記手冊為根據,他算出已過中年的英國人,大約每四千到五千人中,有一人擁有傑出的評價。

高爾頓自稱不介意跟天賦低的人打交道。據他估計,英國兩千萬居民中,約有五萬名「白癡與蠢才」,亦即每四百人中有一個,是他心目中傑出公民的十倍之多。他下結論道,沒有人能懷疑「偉人的存在,他們是自然界最出色的貴冑,生來就注定要成為王侯」。

高爾頓相信,如果凱特爾的假設能適用於身高和胸圍,那麼也該適用於頭圍、腦重量、神經纖維,以及心智能力。他證明凱特爾的發現,符合他自己對從最傑出乃至癡傻的英國人的估計。他得到一個「不可否認,但出乎意料的結論,資質優異的人遠超出平庸之上,而白癡遙遙落在平庸之後」。

高爾頓更希望證明,特殊才能只跟遺傳有關,跟「育幼院、中小學、大學或職業都無關」。遺傳似乎真的很重要,至少從高爾頓設定的參數看來是如此。例如他發現,在二百八十六位法官的近親中,有九分之一是法官的父親、兒子或兄弟,這比例遠比一般人高。甚者,他發現很多法官的親戚做到將軍、小說家、詩人、醫生註──高爾頓刻意把神職人員排除在他定義的傑出人士之外。但他失望的指出,他的研究方法無法區隔傑出者和「與生俱來的白癡」。

高爾頓也發現,遺傳上的傑出持續不了幾代;借用物理學家的術語,傑出的半衰期很短。他發現只有36%傑出的人有子繼承衣缽;更糟的是,他們的孫子只有9%能跟祖父看齊。他試圖用發跡的人喜歡娶繼承大筆遺產的女人這一普遍現象來解釋他們家族的沒落史。天可憐見,這群富婆有什麼地方不對?高爾頓辯稱,她們大都來自生育力不振的家庭,否則就會有一大堆兄弟姊妹分享家族的資源。這個說法倒滿令人意外的,因為他自己就跟六位兄弟姊妹分享父親的遺產,而日子還是過得相當舒適。

常態分配左右對稱

達爾文讀了《遺傳天賦》後,告訴高爾頓:「這是我這輩子讀過最有趣、最具創意的作品……令人難忘。」達爾文建議他繼續研究遺傳統計分析。不過高爾頓根本不需要鼓勵,他已全心投入推廣優生學,熱心發掘和保存他以為有益人類的東西。他要求最傑出的人多生育,資質欠佳的人多節育。

但「離均差定律」(law of the deviation from the mean)卻頑固的礙他的事。他必須設法解釋常態分配內部的差異。他發現唯一的出路就是從頭釐清數據為什麼會形成鐘形曲線。高爾頓這方面的研究讓他完成了影響我們今天大、小決策的偉大發現。

高爾頓在一八七五年發表的一篇論文中,報導了他的第一步驟。他提出,沿平均值兩側、無所不在的對稱分配現象,可能是一系列根據常態分配的影響力所造成──從最不常見的狀況排列到最常見的狀況,然後是相反影響力的排列,從最常見排到最不常見。高爾頓假設,即使在各種影響下,還可以細分為從力量最弱到力量最大,然後又遞減至力量最小。他中心的論點就是,不論好壞,「溫和」的影響總比極端的影響更為常見。

一八七四年,高爾頓以一台叫作「梅花彈珠台」(Quincunx)的儀器,在皇家學會之前證明這個觀念。「梅花彈珠台」看起來像一台垂直放置的彈珠機,有個與沙漏類似的狹窄頸部,這區域羅列了約二十枚彈針。底部是「梅花彈珠台」最寬的部位,有一排小格子。彈珠通過頸部時,會隨機碰觸彈針,然後以高斯模式的典型分布在小格子裡──大多數集中在中間,愈向兩側,數量愈少。

一八七七年,配合「遺傳典型法則」(Typical Laws of Heredity)的宣讀,高爾頓提出一款新型的「梅花彈珠台」(我們不知道機器是否他親手製造的)。這個新機種裡的小格子有分層,彈珠就跟第一個機種一樣,會落在第一層格子裡。但若打開中間的格子,落入其中的彈珠會再度落到底部,排列的方式就是常態分配。

這個發現非常重要。每個團體不論多小,也不論跟其他團體多麼不一樣,就是會以常態分配排列,大部分落在中央,落在平均值上。而當所有團體都綜合為一體時,就像「梅花彈珠台」所展示的,彈珠也會排列成常態分配。因此,常態也就是各小團體平均值的平均。

「梅花彈珠台」二號為高爾頓在一八七五年,根據達爾文的建議而做的一項實驗中,所發現的一個觀念提供了機械證明。這個實驗沒有用到骰子、星星或人類,用的是豌豆──帶莢的豌豆。豌豆生命力強,繁殖力也強,但很少混種交配。豆莢裡的豌豆體積基本上是一致的。在秤過和量過幾千顆豌豆後,高爾頓取七種不同重量的豌豆、各十個樣本,分給散居英倫三島各地的九位朋友,包括達爾文在內,指示他們依照特定的條件,小心培植這些豌豆。

高爾頓在分析結果後說,七種不同豌豆的後代,重量分配的模式跟「梅花彈珠台」預測的一模一樣。每組標本栽培出來的豌豆重量,都呈常態分配,而七種豌豆中的任一種,栽培出來的豌豆,也呈常態分配。他聲稱,這個重要的結果「絕非隨便幾種微小影響力的組合」。事實上,「遺傳的力量……非常重要,不容等閒視之。」因為隨便一群人當中,因傑出人才難能可貴,所以這群人的子孫就很少會傑出;因為大多數人都只是一般水準,他們的子孫也就只是一般水準。平庸的人數總比才華出眾的多。豌豆小──大──小的分布──即常態分配──證實了高爾頓的觀點,子女特質絕大部分決定於父母。

這項實驗還透露另一件事,如下面親系豌豆與子系豌豆直徑表所顯示。

螢幕快照_2019-05-24_下午5_36_30拷貝
Photo Credit: 商業周刊

注意,親系豆直徑之差遠大於子系豆。親系的平均直徑是○.一八吋,實際大小在○.一五至○.二一吋之間,亦即在平均值兩側○.○三的範圍之內。子系的平均直徑是○.一六三吋,實際大小在○.一五四至○.一七三吋之間,或僅在平均值兩側○.○一的範圍之內。子系的分布比親系更緊密。

高爾頓根據這個實驗提出一個如今稱為「均值回歸」(regression to the mean)的觀念。他說:「回歸是理想的子系平均型,脫離親系典型,而返回祖先狀態的傾向。」如果沒有這種緊縮的程序──如果大豌豆的後代一代比一代更大,小豌豆則一代比一代更小──世上就只有侏儒和巨人。每一個世代都變得愈來愈奇怪,各朝我們無法想像的極端發展。

高爾頓以戲劇性的段落,總結了這些觀察:「孩子的遺傳一部分得自父母,一部分得自祖先……族譜向上追溯愈久遠,祖先人數就愈多,也更加多樣化,最後就跟採自任何種族、人數一樣多的任意樣本,沒什麼差別……這一法則使任何天賦都不可能完全遺傳……它執法很公平;對壞品質和好品質課徵相同的遺產稅。一方面打消了卓越的父母讓子女繼承他們所有才能的奢望,另一方面也緩和了子女繼承父母所有缺點與疾病的恐懼。」

不論說得多麼好,這對高爾頓是個壞消息,但它也激勵高爾頓更加努力推廣優生觀念。最明顯的解決方案就是盡可能擴大「原始型」的影響,限制遺傳特質拙劣的人生兒育女,使應居於常態分配左側的人數減少。

高爾頓一八八五年被選為不列顛科學協進會(British Association for the Advancement of Science)主席時,發表了一篇報告,以及證實「均值回歸」存在的實驗。應公眾要求,且獲得經費支持,他觀察二百零五對父母的九百二十八名已成年子女,為這項實驗收集到大量數據。

高爾頓的研究以身高為主。他的目標跟豌豆實驗相同,即了解某些特質如何經由父母遺傳給子女。為了分析觀察所得,他必須針對男女身高差異做校正;他把每個女性的身高都乘以一.○八,把父母的身高相加再除以二。他把得出的數值叫作「父母平均身高」。他也必須確認沒有高男人娶高女人,或矮男人娶矮女人的系統化傾向;他的計算「夠接近」,足供他斷定這一傾向不存在。

結果很驚人。從左下角到右上角的數字,呈對角線排列,較高的父母會生較高的子女,相反亦然─遺傳確實有影響。較大的數字集中在中間,子女的身高呈常態分配,而每組父母生育的子女,身高亦呈常態分配。最後,比較最右邊一欄與最左邊一欄(「中位數」的意思是,團體中一半人高於此數字,另一半人矮於此數字)。父母的平均身高超過六十八.五吋時,子女的平均身高都低於父母平均身高;父母平均身高若低於六十八.五吋,子女身高往往超過父母平均身高,跟豌豆如出一轍。

常態分配與均值回歸的一致性,讓高爾頓可以用數學計算這一程序,例如最高的父母生育比同儕高、卻比父母矮的子女的比例。高爾頓在獲得一位專業數學家肯定時,寫道:「我對數學分析的偉大,從來沒有這麼佩服過。」

高爾頓的分析最後導向「相關」(correlation)的觀念,即任兩個數列對應變化的關係密切到什麼程度。討論的對象可能是父母與子女的身材、下雨與農作物收成、通貨膨脹與利率、奇異公司和百樂健製藥公司的股價。

註釋:高爾頓當然應該承認卡達諾是個傑出人才,但不知他對卡達諾的不肖子作何感想?高斯當然傑出,在遺傳上的成績也還過得去。他有五名子女存活,其中一人是著名的工程師,兩人移民美國,經商很成功─一部分是為了逃避專制的父親;其中一人身兼出色的語言學家、賭徒以及數學家。

相關書摘 ▶《風險之書》:為什麼讓社會不再受機率宰制的目標,仍然無法達成?

書籍介紹

本文摘錄自《風險之書:看人類如何探索、衡量,進而戰勝風險》,商業周刊出版
*透過以上連結購書,《關鍵評論網》由此所得將全數捐贈兒福聯盟

作者:彼得.伯恩斯坦(Peter L. Bernstein)
譯者:張定綺

  • 投資/風險概念世紀經典
  • 投資人、金融保險界、經濟學、數學及資料科學領域必讀
  • 宛如哈拉瑞《人類大歷史》風險版,精彩萬分!

風險管理是現今一項不可或缺的技能,分辨未來可能發生什麼事,從種種可能性當中作選擇的能力,在現代社會中處處可見:無論是投資者買股票,外科醫生動手術,工程師設計橋樑,企業家創業,太空人探索宇宙,政治家競選公職……都不可避免伴隨風險,風險管理已經成為挑戰和機遇的同義詞。

伯恩斯坦用精彩的歷史掌故和人物生平來追溯風險管理的起源:一位位天才以非凡的眼界,一步步如解謎般探索,教我們如何運用未來改善現在。他們讓世人了解風險的內幕,以及如何評估、衡量個中得失,把冒險變成帶動西方社會踏入現代的催化力量。從文藝復興時代的卡達諾開始,到巴斯卡、費瑪、伯努利、高斯……,直到近代發明投資組合的馬科維茨、選擇權定價公式的布萊克、休斯……他們就像漠視眾神禁令的普羅米修斯(Prometheus),深入幽冥,尋找把未來從敵人變成契機的光明。他們的成就改變了管理風險的態度,將人類好賭的天性化為積極開創未來的能量。

伯恩斯坦行雲流水的筆法,讓風險這項複雜的概念讀來趣味橫生:從機率理論、統計抽樣原理、預期壽命、常態分配、均值回歸、賽局理論……逐一量化風險,奠定今日在數學、統計學、物理學、經濟學、管理學等眾多領域根基,將「不確定」逐步「確定」,納入管理和控制,推動現代社會發展。

從頭理解人類探索、衡量風險的歷史,這樣的觀照會讓我們了解當下的立足點,在一場場冒險中掌握勝算。凱因斯說:「如果冒險對人類沒有誘惑力……所謂投資就無非是冷冰冰的謀略。」以「風險」為中心的理念,也提供人類前所未有的機會,追求更豐碩的回報--讓不敢冒任何風險的極端保守者、追尋高風險的投機客、不知風險的賭徒,皆能成為更理性成功的投資人。

本書特色

1. 風險概念世紀經典,投資人、金融保險界、經濟學數學及資料科學領域必讀
「風險」是企業經營、股市投資、金融保險等一切行為得以建立的要素,也是化人類賭性為經濟成長、生活水準提高、科技發展的動力。所有財經、數據學科皆於焉建立。本書為投資人、金融保險界、經濟學數學及資料科學領域讀者不可錯過的經典之作。

2. 述說人類探索風險的傳奇,指引你馴服風險之路
從文藝復興時代的卡達諾開始,到巴斯卡、費瑪、伯努利、高斯……,直到近代發明投資組合的馬科維茨、選擇權定價公式的布萊克、休斯,歷代數學家運用機率、抽樣原理、均值回歸、賽局理論等統計技術,看歷來天才們如何把風險從「受到損失的可能」變成「獲利的良機」。

3. 精彩萬分,身歷其境的閱讀饗宴
小說般的筆法、史詩般的追尋,如哈拉瑞《人類大歷史》風險版般見證歷史脈動,讀者將與偉大思想家同歷一次次知性冒險。

getImage-3
Photo Credit: 商業周刊

責任編輯:潘柏翰
核稿編輯:翁世航

或許你會想看
更多『評論』文章 更多『科學』文章 更多『精選書摘』文章
Loader