《翻轉你的數學腦》:2016年美國大選民調並未錯得離譜,更是1936年以來最準的一次

《翻轉你的數學腦》:2016年美國大選民調並未錯得離譜,更是1936年以來最準的一次
Photo Credit: Reuters / 達志影像

我們想讓你知道的是

2016年,三個搖擺州有很多人直到選前一週都還不知道他們會投給誰,幾乎所有這些搖擺州的選民最終都投給了川普。任何一項民意調查都無法預測這件事,選民自己在民調時也不知道這點。

文:斯蒂芬・布伊斯曼(Stefan Buijsman)

把握不確定性

不需要詢問每一個人

選舉民調已經存在有段日子了。一個多世紀以來,我們就已經有了數學工具,不需要一一詢問,就可以預測整體選民的投票傾向。

實際上,這個想法相當簡單。設想你想知道認為川普適任的人占多少比例。例如,這可能是人口的40%。要知道這點,你不需要一一詢問每一個人對他的看法,那樣做太過繁瑣了。民調背後的想法是只需要隨機抽取,所以你就只需要調查一小群人。如果每個人被抽中到那一小群中的機會都一樣,那麼照樣會有40%的機會在小群中有人認為川普適任。

換句話說,那一小群人相當好的反映了全國人民的想法。

數學用在民調主要是用來計算其可靠性。你可能選擇隨機抽樣的樣本,結果仍然只抽樣到川粉。抽樣的人群愈多,出現那種情況的機率愈小,結果會愈準確。這是說如果所有事項都正常進行的話,因為要做到真正的隨機挑選是很困難的事。

以1936年美國的總統大選為例,那時候美國正處在大蕭條的尾聲,需要做出很多嚴肅的經濟決策。每個人都想知道民主黨的小羅斯福(Franklin D. Roosevelt)和共和黨的蘭登(Alf Landon)哪一個會贏。當時深具影響力的週刊《文學文摘》The Literary Digest),決定對它1000萬的訂戶進行一次民調。這差不多是當時人口總數1億2500萬的10%。這1000萬人中有240萬人參加了民調。

雜誌社隨即發布了這項重大民意調查的結果。他們預測蘭登會以57.1%的機率贏得大選。然而大選結果證明《文摘》的民調完全錯誤,羅斯福以60.1%的得票率取得壓倒性勝利,蘭登只得到36.5%的選票。出了什麼問題?儘管民調的範圍十分廣泛,抽樣卻並非真正的隨機。

《文摘》樣本的取得是根據電話簿、訂戶以及俱樂部與協會的會員名冊。在大蕭條時代只有富人才能負擔得起電話、訂閱雜誌及會費,而且他們也比較可能投給共和黨,《文摘》抽樣的人多數會投給蘭登。

近來,我們還不曾看過如此規模的慘敗——2016年美國大選的民意調查,完全錯誤,專家預測希拉蕊有70%到99%的機會贏得大選。然而,聽起來或許很奇怪,2016年的民意調查卻是1936年以來最準確的一次,它實際上並不像看起來的那麼離譜。

拋開希拉蕊贏得大選的機會,民調顯示希拉蕊得到46.8%的選票,川普得到43.6%。重要的是其間的差異,相差只有3%。最終的結果,希拉蕊得到48.2%的選票,川普得到46.1%。實際選票的差距比預測的略小,只有2.1%。民調正確地預測了柯林頓得到的選票比川普的多。但由於美國選舉制度的本質,川普才得以進入白宮。

總而言之,有三件事情出錯。首先,抽樣並非全然隨機。民意調查隨著時間逐漸改善,然而受過大學教育的人要比沒有的人更願意回應民調,由於這些人更傾向投給希拉蕊,民調錯過了相當大部分的川普選民。就像1936年一樣,要將貧窮及低學歷的選民納入民調,相當困難。

其次,要在讓川普得勝的那幾州進行可靠的民調相當困難。根據民調,賓夕法尼亞州、威斯康辛州及佛羅里達州會投給希拉蕊,他們過去都是這麼投票的。然而2016年,這三州有很多人直到選前一週都還不知道他們會投給誰,幾乎所有這些搖擺州的選民最終都投給了川普。任何一項民意調查都無法預測這件事,選民自己在民調時也不知道這點。

第三,有些人根本不說他們想投給川普,我們不知道他們是否還未決定或者羞於承認。事實就是民調機構經常可以從希拉蕊的選民得到明確的答案。這也不是民調機構的錯,當人們回答問卷時,你無法強迫他們誠實作答。民調中真正的錯誤在於樣本中的教育程度不平衡,其他的因素只是在後來才變得清晰起來。真正出錯的是他們沒能預見賓夕法尼亞州、威斯康辛州及佛羅里達州的轉變。其餘的,他們都對了。

這些例子說明,統計數據並不總能完美呈現我們周遭的世界。即使精確地進行民意調查,也常會出錯。平均值可能會誤導,而完全無關的事物可能有緊密的相關性。這就是為什麼懂點統計學是有用的:知道平均值是如何得出,或意識到相關性只不過說兩個圖看起來相像而已。統計數據可能誤導我們,然而也可以非常有用。

我們看到統計可以用來計算當你檢驗為陽性時,實際上得到癌症的機率。而這個機率可比你沒有計算時所想的要低多了。這麼一來,統計能讓你更好地掌握不確定性。其他的數據,例如平均,對鉅量訊息快速地給出了概觀;它們幫你總結,但並不能完美的顯示情況。我們沒有時間來做這些事,例如,我們無法閱讀所有關於經濟的訊息,那麼幾個平均數讓我們對情況的好壞有了概念,這樣更為有用。

了解這方面的數學是不是很重要?就像微積分,日常生活中你或許不需要親身使用,然而,懂一點這方面的知識很有用。畢竟,我們知道的很多訊息都來自民調及統計數據,它們可能以各種方式誤導我們。檢察總長賽申斯巧妙地利用統計數據,使他的同胞對於國家的安全狀況產生了扭曲的印象。民意調查可能出錯,或許出於偶然,或許出於有意,就看樣本如何抽取。實際上,所有的科學研究都用到統計,以決定實驗結果是否只是巧合。


猜你喜歡

Tags: