零距離科學:人工智能如何預測大選結果?可取代傳統民調嗎?

零距離科學:人工智能如何預測大選結果?可取代傳統民調嗎?

我們想讓你知道的是

人工智能Polly成功預示了脫歐這戲劇性的政治事件。究竟這是純粹的巧合,還是她確能觀察到一些主流分析師遺漏了的趨勢?

文:吳家亮(香港中文大學通識教育基礎課程講師)
圖:香港電台

有人形容2016年是黑天鵝之年,先有英國脫歐,後有特朗普(Donald Trump)當選美國總統,兩項結果都與當時的主流分析相違背。

不過,當年有一部名為Polly的人工智能,卻在留歐派國會議員Jo Cox被殺後更改了預測,從留歐變成了脫歐,成功預示了這戲劇性的政治事件。

究竟這是純粹的巧合,還是她確能觀察到一些主流分析師遺漏了的趨勢?最新一集的《零距離科學》,正要為大家揭開Polly的蘆山真面目,看看她能否準確預測2019年加拿大大選的結果。

勤奮好學的人工智能

Polly作為一部人工智能,具有學習的能力。設計師不用把特定的法則寫進程式裏,而只需要用一堆過往的大數據餵飽她,她便能自行得出一個運算模型,用以推演未來的政治事件。那她的食物是甚麼?原來就是人們在Twitter所寫的信息。

以今次她挑戰的2019年加拿大大選為例,設計師把前一屆2015年大選時人們所寫下的Tweet和當時的選舉結果給Polly作為學習材料,她從中找到了信息跟大選結果的微妙關係,建立並改良了一個運算模型。當2019年大選臨近,她把新的Tweet放進運算模型,便能預測出選舉結果。

Margin_8
Polly以2015年加拿大大選時人們所寫下的Tweet和當時的選舉結果作為學習材料,得出模型應用在2019年大選中。

傳統民調vs.智能運算

這種方式跟傳統上以各種渠道詢問選民來預測選舉結果有很大的差別。

第一,傳統民調需要被訪者主動回應來獲取信息,在回應過程中可能會被問題影響了取態。再者,現今的普羅大眾對民調心生厭倦,甚至會報以相反的答案來使民調失效。但對Polly而言,只要有人在Twitter留下一個Tweet,他/她就會在不知不覺問成為了被分析的對象。Polly只是一個觀察者,不會亦不能干預人們的取態。

Margin_5
現代人機不離手,ASI公司活用社交媒體數據,不靠電話問卷調查,統計民意。

第二,傳統民調只能以特定問題詢問受訪者,一般很難應對一些突發事件。例如,我們不會看到「假如留歐派議員被殺,你會選擇脫歐或留歐?」這類問題。此外,傳統民調只能得到一個過去時間點的意見,而不能知道突發事件的當下民心的改變。但是,Polly不用問問題,她只是持之以恆地分析著人們在Twitter留下的足跡,隨著不同事件的發生,她可以輕易捕捉到大眾想法的轉變。

Margin_7
進人大數據的年代,人工智能能否取代傳統民調來預測選舉結果?

神機妙算的Polly

但是,不是每一個人都用Twitter,那Polly要怎麼樣才能得出一個有廣泛代表性的準確預測?

首先,Polly不會以Tweet作為運算單位,因為這會使數據偏向大量發Tweet的用戶。Polly是以用戶為單位,並會通過一系列準則去驗證用戶是否屬於要被分析的群組。例如,Polly這趟要預測2019年加拿大大選,那她的目標群組當然是加拿大人。即使用戶已表明自己是加拿大人,但Polly仍會審視用戶的朋友是否大多為加拿大人,用戶發的Tweet有否討論跟加拿大相關的話題,例如是寒冷的天氣或是冰上曲棍球。

Margin_9
Polly以加拿大人所發的Tweet預測政黨所獲得的席次。

其次,Polly有加入隨機採樣的運算。大家或許有聽過六度分隔理論,就是世界上兩個互不相識的人平均只需要透過六個中間人就能連繫在一起。Polly採樣時也會考慮用戶的虛擬社交距離是否跟平均接近。這樣,用戶樣本就不會集中在某一撮人,達致廣泛的採樣。

但是,廣泛的樣本並不等於有代表性。為了解決這個問題,Polly會基於人口普查的數據來調節採樣。例如,某個選區只有20%的人為居於市區的年輕男性,Polly運算時如果發現市區年輕男性的用戶樣本過多,就會暫停採集此群組的樣本,讓用戶樣本的分佈跟人口普查相符。

Polly勝過傳統民調?

那Polly的神機妙算是否與最終的投票結果完全吻合?讓我們看看她在2019年加拿大大選的表現。她成功預測到加拿大由自由黨少數派政府執政,對不同政黨所得席位的預測跟真實結果相差了0至8席(見圖)。或許,你會認為這個預測也不是非常準確⋯⋯

Margin_10
Polly的預測跟真實的投票結果相距不遠。

但是,一個更重要的指標是,她有沒有比傳統民調的預測準確?傳統民調機構338 Canada在這次大選成功預測了299個國會議席的結果,Polly則成功預測了308席。那Polly是否可以完全取代傳統民調?那又不然,Polly的預測其實也參考和對照了民調的結果。或許,一個更合適的結論是:人工智能增加了我們對群體取態的了解。

Margin_11
Polly的預測結果比傳統民調機構更為準確。

《零距離科學》(節目網站)集合世界各地有趣的科學紀錄片,網羅與大眾息息相關的科學資訊,啟發觀眾的好奇心和求知慾,節目逢星期五晚9時30分在港台電視31播映。本集於2月26日播出。港台網站及流動程式RTHK Screen視像直播及提供節目重溫。

責任編輯:Alvin
核稿編輯:Alex