Fact-Check「雲吞博士」的自殺數據

Fact-Check「雲吞博士」的自殺數據
Image Credit: Shutterstock

我們想讓你知道的是

日前一篇宣稱分析6月12日至9月10日自殺數據的文章廣為流傳,該文作者認為自殺案在8月下旬開始不尋常地增加,然而他所使用的數據本身有若干問題。

昨日(17日)早上,Facebook專頁「雲吞博士的語言藝術」發表題為〈殺人警察〉的文章,引用其「學術界的朋友」所整理、6月12日到9月10日期間的香港自殺數據,表示8月下旬開始自殺數字大幅增加,認為「數據實在太巧合,令人很難懷疑警察沒有殺人,然後故意毀滅證據」。[1]

文章刊出後在Facebook迅速流傳,截至今日下午6時,「雲吞博士」的Facebook專頁帖文已有超過1萬7千次分享,尚未計算在其他網站、專頁的轉載(無論是否得到授權)。

其後朱孝文使用楊皓文(Benny Yeong)的「2019年香港自殺資料統計」[2]的數據庫分析,得出相反結論︰7月初和3月初的自殺率比9月還要高得多。朱孝文認為原因有二,一是雲吞博士以每10日作為一個區間去點算,他則使用10天平均線,比夠能夠消去數據的隨機性;二是數據庫的差異。[3]

另一作者科豆抽樣檢查過「2019年香港自殺資料統計」數據庫的資料,抽取的5項新聞資料均無誤;而他檢查雲吞博士的原始數據時則發現,單在6月中旬列出的資料已有最少三項錯誤。因此科豆認為朱孝文所用的數據較可靠,重新分析亦得出相同結論。[4]

暫時我未見到雲吞博士有任何回應,而今日他刊出了〈殺人警察〉的英文版本。[5]

我花了點時間檢查雲吞博士那位學術界朋友整理的數據,並跟「2019年香港自殺資料統計」同期數據作簡單對比,得出兩個結論︰一,雲吞博士的立論基礎——其原始數據——有問題;二,雲吞博士本身亦有責任。我認為雲吞博士必須道歉並撤回文章。

雲吞博士的原始數據總共有108項記錄,全部附上有關的新聞連結,我逐一打開檢查後發現最少有17項(15.7%)錯處,當中10項(9.3%)應該刪除,例如並非自殺案、沒有死亡或重複點算,另外7項為日期、時間或死者資料有誤。[6]

即使沒有逐一檢查所有資料來源,其實有些「沒有死亡」或非自殺案的個案,甚至在雲吞博士公開的檔案中已有註明(如「not death」或「industrial accident」),然而他在點算時未有排除這些數字。他在文中亦宣稱其「學術界朋友」整理的資料「當然包含了義士在太古廣場外面墮樓的自殺個案」——相信是指梁凌杰先生,可是其「原始數據」中6月15日有4項記錄,當中並沒有梁先生。

這已經是一大問題︰雲吞博士在分析之前,到底有沒有檢查過數據?有沒有詳細看過自己引用的資料?

然而他的原始數據最大問題不在於資訊有錯,而是遺漏大量個案。如果跟「2019年香港自殺資料統計」中同期自殺死亡數字比較,後者記錄的個案明顯較多,有3天——6月12日、7月2日及7月15日——兩者相距甚至多達5宗。以下是我整理出來兩個數據庫的每日數字差異,以及五天平均線(時間有限,圖表簡陋,請見諒)︰

suicide_data_difference

可見6月至7月期間,雲吞博士的原始數據遺漏較多自殺死亡個案[7],這亦能夠解釋為何他跟朱孝文、科豆二人分析得出截然不同的結論。

我因為時間有限,未有全面檢查「2019年香港自殺資料統計」的資訊,僅抽查了10項記錄的日期、性別、年齡及是否死亡(該數據庫記錄了未有死亡的個案)資料,確認無誤,另外我認為這個資料庫的記錄較有系統。如果發現有錯,敬請指出。另外必須強調,單從自殺數據難以判斷有否「被自殺」的情況,如果涉及個案數量少則更難得到結論。

雲吞博士掛着「博士」之名,又以「做學術的人」自居[8],我希望他能夠承認錯誤,撤回文章,並向大眾盡力解釋其分析有問題之處——畢竟帖文已經廣為流傳,難以收回。

8月31日在太子站到底發生了甚麼事,公眾有權知道,我認為港鐵必須盡可能(在符合私隱要求下)公開閉路電視畫面,消防處及警方都應該盡力解答所有質疑。我明白很多人都非常擔心、憂慮,亦不相信政府、警隊(這很合理),但請大家記住,容許錯誤訊息流傳,就令到其他更重要的質疑可能被忽略。

公權力失信,我們只能夠更謹慎小心去尋找真相。

(感謝科豆檢查雲吞博士的原始數據,讓我知道其問題。)

相關文章︰

註︰

  1. 殺人警察(雲吞博士的語言藝術Facebook專頁帖文)
  2. 2019年香港自殺資料統計Facebook專頁
  3. 朱孝文 Lanston Facebook專頁帖文
  4. 科豆 Scientific Papa Facebook專頁帖文
  5. Police Murder(雲吞博士的語言藝術Facebook專頁帖文)
  6. 詳見此處,我把雲吞博士的原始數據複製了一份,並於備註解釋問題所在。
  7. 詳細數據見[6]的「每日數字比較」工作表。
  8. 他在文中表示「作為做學術的人,未有足夠證據之前,都不能輕信消息」,又引用「學術界朋友」整理的數字。

核稿編輯︰歐嘉俊