記者如何從過千萬的巴拿馬文件中找出有用資訊?

記者如何從過千萬的巴拿馬文件中找出有用資訊?
Image Credit: TongRo Images / Corbis / 達志影像

我們想讓你知道的是

巴拿馬文件洩密者傳送了過千萬份文件,規模遠超以往洩密案。國際調查記者同盟的開發人員為此設計了一套搜尋系統,讓參與調查的記者能夠在海量數據中尋找有用資訊。

由德國《南德意志報》(Süddeutsche Zeitung)透過匿名來源獲得、其後跟國際調查記者同盟(International Consortium of Investigative Journalists, ICIJ)共同調查的「巴拿馬文件」,顯示不少國際政商名人使用莫薩克•馮賽卡律師行(Mossack Fonseca & Co.)的離岸公司服務。

使用離岸公司服務本身並非違法,例如有商業機構或會為避開當地嚴格的貨幣限制,而透過離岸公司處理部份資金。莫薩克•馮賽卡律師行的聲明亦表示該公司提供的服務合法,他們會跟執法部門及監管機構合作,防止任何人不當使用其服務。

普亭、梅西皆涉其中 「巴拿馬文件」披露全球權貴財富動向

然而ICIJ指巴拿馬文件顯示,處理離岸公司業務中的各個角色,包括銀行及律師行等,未有按照法律要求去確保其客戶跟犯罪集團、逃稅或貪腐無關。有離岸公司中介人甚至透過隱瞞交易、篡改記錄等手段來保護自己及其客戶。

過千萬份內部文件

是次洩漏予ICIJ的文件多達1150萬份,包括逾480萬封電郵、近305萬個莫薩克•馮賽卡內部數據庫的片段、215萬多個PDF檔案、約112萬張圖片及32萬個文字檔等,內容由1970年代至2016年春天。

巴拿馬文件的檔案大小總和約2.6TB,規模遠超近年幾次大型密件各洩事件,例如2010年維基解密洩露美國外交電報事件(1.7GB)等2013年ICIJ調查兩萬多名中港投資者在離岸金融中心註冊公司(260GB)。這是新聞界有史以來最大量的洩密資料。

面對海量的文件,過百家傳媒機構逾400名記者花費超過1年時間合作分析,才把事件公之於世。匿名的洩密者僅希望ICIJ方面採取若干安全措施,除此以外不求任何回報。

匿名的洩密者

最先接觸洩密者的《南德意志報》,曾經報導另一宗跟莫薩克•馮賽卡律師行有關的小規模洩密,檔案由德國的監管機構收到。該報記者Bastian Obermayer於2014年尾開始,收到洩密者透過加密電郵聯絡及傳送相關檔案,希望「能把這些罪行公開」。

當時洩密者警告其生命受到威脅,只願意使用加密通訊聯絡,並拒絕親身見面。Obermayer問︰「我們談論的數據有多少?」據說洩密者回覆︰「比你以往見過的還要多。」

兩人經常轉換各種加密渠道來通訊,但Obermayer拒絕透露實際使用的加密方式。每次通訊後他們會清除所有通訊記錄,而當使用新的加密渠道通訊時,會以先前訂立的問題及答案來確認對方身份。

傳送、處理海量資料

收到一定數量的文件後,《南德意志報》聯絡ICIJ,後者派職員到慕尼黑跟該報記者商討調查事宜。與此同時,洩密者繼續逐點逐點把文件洩露,直到1150萬份文件。Obermayer不願解釋洩密者如何傳送數以百GB有多的檔案給他們,僅婉轉地表示︰「關於如何安全地傳送大型檔案,我學會了很多。」

洩密的檔案均按照同一結構存檔︰莫薩克•馮賽卡律師行設立的每家公司均有一個資料夾,當中包括跟該公司有關的電郵及合約等文件。某些資料夾會有多達數千頁文件,而巴拿馬文件涉及的公司數量超過21萬,任何人也難以讀完所有文件,遑論整理出有用資訊。

特製搜尋系統

有見及此,《南德意志報》及ICIJ把文件上載至其高速電腦,以光學文字識別(OCR)技術把圖片,例如掃描的護照、身份證明文件及合約等,轉換成容易以電腦搜尋內容的文字檔案。經過這個步驟,記者才能夠梳理出文件的相關人物、公司等重要資料。

ICIJ的開發人員其後建立一個搜尋系統,採取雙重驗證保護以免資料及調查工作外洩,系統的網址以加密方式電郵予各家參與調查的傳媒機構,包括《衛報》及《BBC》等。記者更可以在該網站上即時通訊,以交換資訊、調查方向甚至是尋求翻譯。

ICIJ總監Gerard Ryle解釋︰「假如你想查看巴西的文件,可以找一位巴西記者。在即時通訊系統中你能夠看到誰在線工作,並能夠公開通訊,我們鼓勵所有人把自己手頭上的工作告訴其他人。」其後不同的傳媒機構也在華盛頓、慕尼黑、倫敦、約翰尼斯堡及利勒哈默爾舉辦會議,讓記者親身討論調查進展。

不會公開所有資料 洩密者身份成謎

根據ICIJ就巴拿馬文件設立的網站,他們將於5月初發放巴拿馬文件涉及的公司和人物清單。Ryle表示ICIJ及參與調查的媒體均無意像維基解密一樣,公開發佈所有收到的檔案。他認為這樣做的話,會暴露文件中一些無辜者的敏感資料。Ryle指他們「希望示範如何負責地報導新聞」,建議記者發掘跟其所在地公眾利益有關的新聞。

巴拿馬文件持續燃燒:一次看懂這次披露為何震撼、各國政要又如何面對?

在聯絡其調查對象(包括莫薩克•馮賽卡律師行)前,Obermayer採取了最後的預防措施︰他破壞了用作聯絡洩密者的電話及電腦硬碟。他解釋︰「這似乎有點兒過火,但安全總比遺憾好。」至今Obermayer仍不知道洩密者的真正身份,但他表示︰「我會說我認識這個人,有段時間我們的對話比我跟妻子還要多。」