《泛蠢》:群眾智慧——為何一群泛泛之輩,能做出優於專家的預測?

《泛蠢》:群眾智慧——為何一群泛泛之輩,能做出優於專家的預測?
Photo Credit: Shutterstock / 達志影像

我們想讓你知道的是

本書取材自商業、運動、科學,以及日常生活中的鮮活故事,勾勒出降低犯錯可能的方法,包括「準備」面對常見的心智陷阱,「認知」情境中的錯誤,以及「運用」正確的心智工具來形塑更好的決策。讓讀者做對決策,穩健投資、職場長勝!

文:麥可.莫布新(Michael J. Mauboussin)

第三章【思考盲區3】專家限制——演算法比較可靠嗎?

店員比不上演算法

1990年代初期,我和妻子住在紐約市。晚上無事時,我們會租片回家觀賞。就如同那個時代其他影片出租店一樣,店裡會有一兩位店員根據你之前喜歡的影片及你當時的心情,非常熱絡地向你推薦,甚至可能不時會推薦一兩片你不常看的影片。考慮到他們相對不算多的電影庫存,以及對我們的電影口味有限的知識,這些員工算是相當有幫助的。

DVD影片租借網站Netflix設立於1997年,以客戶滿意度為核心考量,初期便成功依據訂戶的喜好,介紹匹配的影片,業務因而蓬勃發展。2000年,這家公司推出名為「Cinematch」(影片配對)的服務,由一套演算程式系統,執行觀眾和光碟的配對。Cinematch利用消費者回饋的資訊提供推薦,迅速改善預測消費者口味的準確度,讓用戶持續感到滿意及減少對新片發行資訊的依賴。

Cinematch目前已帶動Netflix一半以上的租金收入。但公司管理階層意識到,Cinematch並非所有問題的答案。因此在2006年,他們發出戰帖:只要能提出更好的電腦程式,在預測消費者偏好的準確度上,比Cinematch高出一成,Netflix願意支付100萬美元獎金。

撰寫這本書時,該筆獎金仍在各方爭奪之中,領先團隊的程式比Cinematch準確9.8%。有兩個值得強調的重點:第一,有些人雖然聰明絕頂,但處理問題的價值和Netflix相較之下卻是小巫見大巫。(Netflix的主管不諱言,一個成功演算法的價值超過100萬美元。)第二,無論是Cinematch或任何最終取代它的程式,其表現都大幅優於紐約市影片出租店的員工。

Netflix的演算法,以及和當地影片出租店員意見的品質之間南轅北轍的對比,說明了本章第一個錯誤的決策制訂:利用專家,而不是數學模型。我承認,這個錯誤對各領域的專家而言是個直接的侮辱,令人難以忍受。但是在社會科學領域,這也是紀錄最為詳盡的研究發現。

1954 年,明尼蘇達大學心理學家米爾(Paul Meehl)出版一本書,評論專家(心理學家和精神病學家)的臨床判斷與線性統計模型的研究。他認真分析,有信心做到公平的比較。在一次又一次的研究後,他發現統計方法不輸(甚至超過)專家的表現。

較近期的例子是,加州大學柏克萊分校心理學家泰洛克(Philip Tetlock)針對專家預測,完成一項歷時15年以上的周詳研究,其中包括來自60個國家300位專家的2800項預測。泰洛克請專家針對有機率性質、結果範圍廣泛的政治和經濟案例的結果進行預測。總結這些研究發現,泰洛克斷然表示:「不可能找到任何人類預測能力明顯優於外推演算法的領域,複雜的統計方法就更不用說了。」

儘管有幾十年充分的證據,各領域依賴專家的傾向依然毫無變化。事實上,大多數人很難吸收廣泛的統計證據,以融入他們的判斷中。當你面對如何挑選影片的決定時,問問自己,比較希望得到Cinematch提供的推薦,還是影片出租店櫃檯後頭的店員。現在,你已知道何者最可能提供你最大的觀賞樂趣。

群眾智慧

在百思買的例子,非專家集體做出優於專家的預測,顯示我們在此要介紹的第二個決策錯誤:依靠專家的智慧,而不是群眾。想了解集體為何通常是明智的(且有時是很不明智的),我們需要深入了解群眾智慧運作的方式。但在進行之前,請思考以下問題:一群不是專家的人,怎能做出優於專家的預測?

社會科學家史考特.佩吉(Scott Page),曾針對群體解決的問題進行研究,並對了解集體決策提供非常實用的方法,稱之為「多樣性預測定理」(diversity predictiontheorem)。該定理陳述如下:集體誤差=平均個人誤差-多樣性預測這個定理使用社會科學和統計研究人員普遍採用的平方誤差做為精確度的評量,因為它確保正誤差和負誤差不會相互抵消。

平均個人誤差掌握了個人猜測的準確性,你可以把它視為一種衡量能力的評量。多樣性預測反映了猜測的分散情形。集體誤差,意即正確答案和平均猜測之間的差距。在佩吉的著作《差異》(The Difference)裡,他深入討論多樣性預測定理,並大量提供該定理運作的例子。

在解釋多樣性預測定理時,我會要求學生猜測罐內軟糖豆的數目,讓他們了解集體誤差、平均個人誤差及多樣性預測。例如有一年,學生平均猜測1,151顆軟糖豆,實際為1,116顆,誤差約為3%。個人的猜測與平均猜測差最多的約700顆。但是,多樣性之高,足以抵消大部分的個人誤差,留下一個小的集體誤差。

多樣性預測定理告訴我們,多樣性群眾的預測絕對比群眾裡一般的個人更為準確,而且總是如此。大多數人並不認為自己是平凡之輩。然而,在現實中,有半數的人必然低於平均水準。因此,我們該認清自己何時會是低於平均的那一半。

同樣重要的是,你可以透過能力或是多樣性的增加,來減少集體誤差。能力和多樣性兩者必不可少。對於衡量市場的健康或建立成功的團隊,其影響力都是息息相關的。

最後,雖然此定理並未清楚表明,但集體往往優於個人,即使是最優秀的個人也不例外。因此,一個多樣化的集體總是凌駕於一般人之上,而且通常擊敗每一個人。在軟糖豆實驗中,73位學生的猜測只有2位比共識準確。對專家來說,這可不是好消息,且必然深深震撼所有的決策者。

有了多樣性預測定理的加持,我們可以更加了解,在何種情況下群眾可以預測得很好。三個條件必須到位:多樣性、整體性和誘因。每個條件在方程式中都不可或缺。

多樣性可以降低集體誤差;整體性則保證市場會把每個人的資訊都納入考慮;誘因會鼓勵人們,只有自認具備獨到觀點時才會參與,以減少個人的誤差。

當然,集體不能解決所有的問題。如果你的水管需要修理,你最好找位水電工人,而不是召集主修英國文學的學者、和平工作團和天體物理學家一起工作。但當遭遇複雜問題,且具體規則無法解決時,多樣性的群體通常比專家更有價值。

專家也要練過才能使用「快思」

在最近的一次調查中,幾乎有一半的財星千大企業經理人表示,他們在制定決策時依靠直覺。事實上,許多暢銷書大力推崇直覺,而且商業和醫療產業巨擘也特別尊崇出於直覺(看似高深莫測)的決策。問題是:直覺不是絕對有效的。這個想法引出我們要提出的第三個決策錯誤——不恰當地依賴直覺。在制定決策時,直覺能夠發揮明確和積極的影響力。但你必須清楚辨別,直覺何時對你有利,而何時又會引你步入歧途。

各位可以看看丹尼爾.卡尼曼在2002年諾貝爾經濟學獎演講時,所描述的兩種決策制定系統。第一套系統是經驗系統,特點是「快速、自動、不費力、聯想,以及難以控制或修改的」。系統二是分析系統,特點為「比較緩慢、一系列的、要付出努力,以及審慎控制的」。

在卡尼曼的模型中,第一套系統利用知覺和直覺,產生關於對象或問題的印象。這些印象是自然而然產生的,個人可能無法解釋。卡尼曼主張,不論個人是否有意識地做出決定,所有的判斷都牽涉到第二套系統。因此,直覺是反映印象的一種判斷。

透過在特定領域實際且審慎地操練,專家可以培養和增強他們的經驗系統。因此,國際西洋棋大師可快速地審度棋盤上的布局,以決定在特定的比賽中該怎麼做。事實上,專家會將正在處理的系統特徵內化,釋出注意力到高層次的分析思考。這也說明了專家普世的特徵,其中包括以下特質:

  • 專家會看出自身專長領域的模式。
  • 專家解決問題的速度遠比新手快。
  • 專家說明問題的層次比新手深入。
  • 專家可以質化的方法解決問題。

因此,直覺在穩定的環境行之有效。然而,當你面對的是一個不斷變化的系統,尤其是涉及階段過渡時期,那麼運用直覺便會造成失敗的結果。儘管直覺的力量近乎神奇,但在日益複雜的世界卻逐漸失去作用。

讓我再強調一點。人要成為專家,必須經過審慎、刻意的練習,培養經驗系統。刻意練習有個非常具體的意義:它包括旨在提高績效的活動,具有可重複的任務,結合高品質的意見回饋,而且沒有多少樂趣。大多數人(甚至所謂的專家)離這些刻意練習的條件都還差得遠,因而無法建立起可靠直覺所需的能力。

盲從的主因

我已讚美過電腦和群眾的美德。現在,讓我敲響在本章提出最後一個錯誤的警鐘:傾向以公式為基礎的方法或群眾的智慧。雖然電腦和集體的建議確實有效,但不值得盲目信從。

麥爾坎.葛拉威爾(Malcolm Gladwell)所稱的「誤配問題」(mismatch problem)便是對數字過度依賴的例子。

當專家用表面上客觀的評量,來預測未來表現時,便犯了這個錯誤。在許多情況下,專家所仰賴的評量標準幾乎沒有(或根本沒有)預測的價值。

職業體育的聯合選秀,就是一個說明誤配問題的突出例子。聯盟在選拔之前,會召集具潛力的業餘頂級球員,在球探仔細觀察之下,透過一系列循環測試以評估技能。這些測試包括舉重、跑步和敏捷性演練等體力訓練,以及心理測試。之後根據表現,評鑑每一位球員。在某些情況下,球員表現相對較好或較差,會對其選秀排名造成重大影響,因此也關係到他未來的預期收益。聯合選秀是有壓力、高成本且費時的。

但是商業教授法蘭克.庫茲密茲(Frank Kuzmits)和亞瑟.亞當斯(Arthur Adams)在詳細檢討國家足球聯盟的選秀結果之後發現,聯合選秀排名和隨後的表現並無一致的關係(有一例外,衝刺的速度有助於預測跑衛的表現)。曲棍球和籃球聯合選秀的結果也是相似的。雖然測量是定量和標準化的,但是測量的標的卻是錯誤的。

葛拉威爾認為,誤配的問題不僅存在於體育運動。他舉出許多其他領域的例子,如教育(學歷無法完美預測績效表現)、法律專業〔靠著平權措施(affirmative-action)進入法學院就讀的學生,畢業之後的表現和他們的同學一樣好〕,以及執法人員(魁梧的身材和警察工作本身未必有關)。你可以很輕易地看出,這個問題會如何延伸到各種類型工作的面試,因為未來的表現幾乎難以從這些問題和答案看得出來。

盲目跟從群眾智慧也是愚蠢的。雖然自由市場信徒認為,價格反映了最準確的評估,但市場是極端容易出錯的。這是因為,當群眾智慧的三個條件中,任何一個或多個條件遭到違反時,集體錯誤就會膨脹。這也難怪,多樣性是最有可能失敗的條件,因為我們天生是社會性和模仿性的。大棕馬將贏得2008年貝爾蒙馬賽,其過度美化的機率便是說明「多樣性崩解」(diversity breakdowns)一個很好的例子。1990年代後期達康(dot-com)時代股市的過度投資,以及2007至2009年的金融危機都是同樣的例子。

在了解多樣性崩解的過程方面,科學家已取得良好的進展。例如,當人們根據其他人的行動,而不是根據自己的見解做出決策時,就會產生「資訊階流」(information cascades,編注:當超過一定人數後,人們便會停止依賴自己的知識,轉而模仿其他人的行為)的誤導現象。這些階流有助於解釋蓬勃發展、潮流、時尚和崩潰。研究個人或組織彼此之間如何相互關聯的社會網絡理論(social network theory),對於這些階流如何傳遍整個社會,提供完整的解釋。

多樣性崩解也會發生於較小的群體。如果你曾經參加過委員會、陪審團或工作小組,你可能已經看過這種現象。多樣性的喪失通常源於某個領導者的主導、某事實的付之闕如、或群組中的認知同質性。

哈佛大學法學院教授凱斯.桑思坦(Cass Sunstein)和一些同事為了說明後者,把自由派與保守派分開,讓他們與志同道合的人在一塊,思考在社會上具爭議性的議題,如同性婚姻和平權措施。在大多數情況下,與事前的面談相較,這些人士在經過分組後表達的意見較極端。個人和所屬小組在一起之後,意見會變得更具同質性。沒有了多樣性,集體觀點(不論大小)都有可能變得離譜。

究竟該怎麼做,才能讓專家限制為你所用,而不是對你不利?以下提供一些建議:

1. 為你面對的問題配置最合適的解決方案。正如我們在本章中所看到的,各式各樣的決策制定問題需要各種解決方案配合。因此,仔細考慮你正在制定什麼樣的決策,以及哪一種方法可能對你最有幫助。我們所知道的是,專家在許多情況下表現並不好,建議你應該嘗試其他方法以補充專家的意見。

2. 尋求多樣性。泰克的研究工作顯示,雖然專家的預測在整體上並不理想,然而有些專家的表現還是好過其他專家。預測能力的高低,看的不是哪一位專家或是他們相信什麼,而是他們如何思考的方法。泰洛克透過以撒.柏林(Isaiah Berlin,編注:著名的哲學家及自由主義思想家)的一篇短文,引用古希臘詩人亞基羅古斯(Archilochus)的名言(編注:此名言為「狐狸知道很多事,但刺蝟只知道一件大事。」)——把專家分為刺蝟和狐狸兩類。刺蝟只會一件看家本領,並嘗試透過這個鏡頭為一切事物找到答案。狐狸則是對許多事情都知道一點點,不會以單一答案解釋複雜的問題。

泰洛克發現,狐狸是比刺蝟更好的預測者。狐狸看重多樣性的重要,結合「不同的資訊來源」,並從中做出決策。當然,刺蝟不時會有對的時候,但長期而言,預測準確度還是比不上狐狸。對於許多重要決策,多樣性在個人和集體的層次都是關鍵。

3. 盡可能運用科技。如百思買和哈拉斯賭場,利用科技抵消專家限制的影響力。儘管愈來愈多企業運用科技和數據來解決問題,但數量之寡還是讓人擔憂。

谷歌(Google)面對眾多的求職者,意識到大多數面談都落得徒勞無功的下場,因此決定開發演算法來找出有吸引力的潛力員工。首先,公司要求有經驗的員工填寫附有300則問題的調查問券,以掌握其職位、行為和個性的相關細節。公司接著比較調查結果和員工的績效評量,尋求中間的連結。透過這項調查,谷歌的主管發現到,學業成就與在職表現不見得具備絕對的相關性。這種新穎的做法讓谷歌得以迴避缺乏效果的面試,並著手化解箇中的分歧。

有時候,組織不會利用現有的相關資訊。幾年前,我與美國紅十字會負責災害服務的高級行政主管(負責對國家層級災難進行準備、反應的人物)同在一個小組會議。他談到卡翠娜颶風後救災工作的驚人故事,並提及其他可見的風險。輪到我時,我和大家分享各種災害的機率——禽流感的蔓延、恐怖行動、颶風頻率——這些資料是根據我當天上午從某個預測市場瀏覽的資訊。

這位執行主管顯然對我的評論很感興趣,正式會議之後隨即來找我面談。我討論的災難正是他基於職責應該擔心的,但他永遠無法判斷實際發生的機率。只因他沒有意識到,原來外頭有這類數據可供參考。

你可以在書架上擺滿吹捧群眾智慧、直覺、電腦數值運算(number crunching)或專家的書籍。但身為一位深思熟慮的決策制定者,你的首要任務在於辨別問題的本質,然後考慮最理想的解決辦法。所有的方法都有利弊,沒有任何解決方案是獨一無二的。

也就是說,專家限制是真實存在的問題。科技讓決策制定者可以獲得寶貴的見解,有些組織甚至發展可以告知其決策的新方法。但最大的障礙在於,大多數人在心態上還是不能適應,無法把先前由專家決定的事情交由電腦或群眾來解決。雖然對專家不利的證據確鑿,人性仍然是個難以跨越的障礙。

書籍介紹

本文摘錄自《泛蠢:偵測99%聰明人都會遇到的思考盲區,哥倫比亞商學院的高效決斷訓練》,八旗文化出版

作者:麥可.莫布新(Michael J. Mauboussin)
譯者:胡瑋珊

  • momo網路書店
  • Readmoo讀墨電子書
  • Pubu電子書城結帳時輸入TNL83,可享全站83折優惠(部分商品除外,如實體、成人及指定優惠商品,不得與其他優惠併用)
  • 透過以上連結購書,《關鍵評論網》將由此獲得分潤收益。

蠢是常態,聰明人也不例外
別把該慢想的事,丟給快思負責

精明如你,為何總是做出令你扼腕的選擇?
貝佐斯、魔球經理人比利.比恩也肯定的決策心法
拒當盤子,就要擺脫思維慣性!

沒有人一早醒來就想著,「今天我要做出壞決定」。
然而我們都會做出壞決定,尤其聰明的人,往往會做出愚蠢的壞決定。
從金融危機到高知識分子遭遇詐騙,我們經常看到訓練有素的專家,
在毫無惡意的情況,卻犯下後果慘重的錯誤。

本書揭露「蠢」的一切根源——人類最常忽略的8個思考盲區
讓你做好心智準備、認知到錯誤、改善心智工具,選出最佳解答!

如果不能擺脫思維慣性,極容易掉入大腦先天的「決策陷阱」。大至決定是否要併購一家公司,小至應該為紀念日挑選哪一瓶紅酒,我們交由大腦扛起了理性的重責大任,最後卻和膝反射無異,究竟是哪個環節不夠周全?

本書取材自商業、運動、科學,以及日常生活中的鮮活故事,勾勒出降低犯錯可能的方法,包括「準備」面對常見的心智陷阱,「認知」情境中的錯誤,以及「運用」正確的心智工具來形塑更好的決策。讓讀者做對決策,穩健投資、職場長勝!

下決定前必先掌握策略
本書作者莫布新利用自己在投資產業的經驗,加上心理學、科學上的知識,分析個案決定「錯誤」的關鍵,點出思維慣性的缺陷,教大家避免「犯蠢」的三個步驟——

【STEP 1】做好心智準備:認識錯誤案例,檢討其原因。
【STEP 2】認知情境問題:找出「錯誤」的關鍵,了解到犯錯的風險程度及可能性。
【STEP 3】建造心智工具:因應生活情境建立技能,減少潛在錯誤的可能。

搞清楚「蠢」從何而來?
我們的大腦如《快思慢想》一書所言,會運用不同系統思考。麥可.莫布新試著反問讀者,從直覺(快思)轉入到邏輯思考(慢想)後,你會如何思考問題?如何行動?還有你可能不知道運氣會在這一系列過程中,扮演什麼樣的角色?有利的結果是否能代表思維過程正確?理解以上問題,你才會知道自己「蠢」在哪裡。

蠢沒有錯,蠢在你以為自己不會錯。不想「聰明反被聰明誤」,你應該試著理解自己的思考盲區,決策前「再想一下」,讓哥倫比亞商學院的「年度傑出教授」麥可.莫布新,透過本書教你如何做高效決斷的訓練。

(八旗)0UNF0027泛蠢-立體(書腰)300dpi
八旗文化出版

【加入關鍵評論網會員】每天精彩好文直送你的信箱,每週獨享編輯精選、時事精選、藝文週報等特製電子報。還可留言與作者、記者、編輯討論文章內容。立刻點擊免費加入會員!

責任編輯:翁世航
核稿編輯:王祖鵬