「劍橋分析」的手法並不新,早在1960年就有人想用電腦猜透人腦

「劍橋分析」的手法並不新,早在1960年就有人想用電腦猜透人腦
Public Domain

我們想讓你知道的是

你以為群眾分析是在社群媒體之後才出現的嗎?其實它是上個世紀的產物。當時群眾分析不只幫甘迺迪預測美國民眾的投票傾向,還嘗試用來對抗共產主義與解決內亂,但後來成功了嗎?

文:江彥成、黃思齊

2016年,「劍橋分析」(Cambridge Analytica)公司在美國總統大選期間,透過Facebook上免費的心理測驗竊取用戶個資,並利用這些資料左右選民的投票傾向。同年英國脫歐公投,支持脫歐的倡議團隊也曾利用類似的個資漏洞,操弄選民的情緒,使得「同意脫歐」的票數以些微之差勝出。

除此之外,若你曾經在美國銀行或陸軍工作,你很有可能聽過Humanyze這間公司。這個由麻省理工Media Lab催生的新創公司,專門提供具有追蹤功能、內嵌RFID(Radio Frequency IDentification,無線射頻辨識技術)的識別證、NFC(Near-Field Communication,近距離無線通訊)感測器、能記錄說話者對話時的語調與音量的內建式麥克風等產品,「以科學分析方法,打造更健康、高效的工作環境。」

若你是在健康照護、零售或金融服務商工作,則很有可能使用過Receptiviti所開發的軟體。透過監控員工的電子郵件和Slack(通訊軟體)訊息中負面用詞的出現頻率,Receptiviti宣稱可以「幫助機器更了解人們」,培養企業內部的「集體正念」(corporate mindfulness)。

提供這類群眾分析(people analytics)服務的服務商,往往對外宣稱以「提升效率」或「改善客戶體驗」為主要目的,卻刻意迴避一些基本問題,例如:誰應該知道你的什麼訊息?他們知道的資訊有多細?是否符合實際情況?他們將這些資訊用在哪裡?以及,最關鍵的,「人類行為」真的可以以一個演算法來概括、預測嗎?

歷史上的群眾分析

這些問題並不新,歷史上有許多人都試圖回答過。

1959年,一間稱為Simulmatics的公司在紐約市成立,名字是「simulation」(模擬)與「automatic」(自動化)兩字的混成字。創立Simulmatics的人其心各異,有單純希望揭開人類行為秘密的瘋狂社會科學家迪索拉普(Ithiel de Sola Pool,他也是最早預見社群網路潛力的學者之一),也不乏看上其中商業利益的廣告人格林菲爾(Ed Greenfield)。

他們擁有同樣的目的:利用稱作People Machine的電腦程式,將群眾分門別類,並模擬各類族群的行為模式,以此來預測或操弄人類行為,或更精確來說,「選民的投票傾向」。

AP_621022034
Photo Credit: AP / 達志影像
1961年當選美國總統的甘迺迪

20世紀中期,美國共和黨開始像推銷日常雜貨的方式向選民介紹黨內的政治人物。民主黨不甘示弱,找上了剛成立的Simulmatics,打算來一場(在當時)「跨時代」的廣告行銷。於是Simulmatics的第一個大客戶,正是參加1960年美國總統大選的民主黨候選人,同時也成功成為美國第35屆總統的甘迺迪。

Simulmatics的成功,在當時引起了不小騷動,認為這類技術服務會侵蝕民主體制的基石(Facebook則是將近半個世紀後的事了)。

儘管如此,Simulmatics仍然引起了五角大廈的興趣,認為可以用來阻止共產主義的擴張。1966年,迪索拉普與美國國防部合作,在越南西貢(今胡志明市)展開大規模行為科學研究。當時的美國國防部長高華德(Robert Barry Goldwater)和迪索拉普都天真地以為,能在「心靈和思想」上征服越南人。

除了外戰,Simulmatics也曾被應用於內亂。1965年起,美國境內各處開始出現因為種族衝突而引發的暴動與民亂,終導致「1967年的長夏」(The Long, Hot Summer of 1967)。不堪其擾的美國總統詹森,於是召集了「國家內亂諮議委員會」(National Advisory Commission on Civil Disorders,通常以該委員會主席的姓氏暱稱為「Kerner委員會」)以為因應。Simulmatics則又受Kerner委員會的委託,預測騷亂可能發生的地點與時間,讓當局可以預先準備。

和在越南的任務相同,Simulmatics再一次徹底失敗,不久便宣告破產。

這個世界太複雜

在此之前,歷史上還有許多類似的群眾分析研究,比如20世紀初的優生學運動(eugenics),都試圖藉著數據的搜集與系統化,在政府單位的配合下,將群眾以種族(race)與族裔(ethnicity)分門別類,並以此預測他們的行爲。Simulmatics或許是其中最不為人知,但卻最接近成功的一次嘗試。

Simulmatics的失敗,不可否認地,部分歸咎於1960年代硬體設備上的不足與限制——數據不足、電腦太慢、設備破爛,導致模型的預測能力不足。然而更重要的一點,以及Simulmatics今日在矽谷的後代都忽略一項事實:美國選民與越南鄉村人口之間的差異、美國國內有色人種與高加索人種間的差異,人類行為以及社會的複雜和多樣性遠超乎科學家的想像!

1966年,在美國國會有關數據隱私的聽證會上,RAND智庫的科學家為議員列出了一系列立法重點:什麼是數據(data)?數據屬於誰?數據的收集者、持有者與分析者各負有哪些責任與義務?數據可以共享或出售嗎?這類大哉問隨著Simulmatics宣告破產而無疾而終。

直到現在,群眾分析的技術已經十分成熟了,卻還遲遲等不到答案。

參考資料

本文由臺大科學教育發展中心授權刊登,原文發表於此

延伸閱讀

責任編輯:丁肇九
核稿編輯:翁世航


Tags: