《暗數據》:沒有人在森林裡聽見樹倒了,不代表樹沒發出聲音

《暗數據》:沒有人在森林裡聽見樹倒了,不代表樹沒發出聲音
Photo Credit: iStock

我們想讓你知道的是

本書探討許多對於暗數據視而不見的情況,討論這些情況如何讓我們做出錯誤、危險,甚至災難性的結論與行動。如今我們所有人都仰賴數據做決定。本書將告訴我們如何避免做出壞的決定。

然而,事後分析顯示,珊蒂颶風相關推文最多來自曼哈頓,只有少數推文來自洛克威海灘或康尼島等地。這表示洛克威海灘和康尼島受創較不嚴重嗎?的確,曼哈頓區的地鐵和街道都淹水了,但很難說是受創最重的地區,就算只論紐約亦然。想也知道,實情是推文較少的地區之所以如此,不是因為受到颶風衝擊較小,純粹是因為那裡的推特用戶較少,比較少人有手機可以貼文。

其實,同樣的狀況我們可以推到極端。假設有個地方被珊蒂颶風徹底摧毀,那個地方就不會有推文出現,結果可能讓人以為那裡一切無恙。這可真是暗數據,黑暗得很。

和第一型暗數據一樣,第二型暗數據(我們不知道有所遺漏的數據)也是無所不在,只要想想沒被查到的詐騙案或查無凶殺案的被害者訪查報告,就會明白我的意思。

對於前兩型暗數據,你可能覺得似曾相識。前美國國防部長朗斯菲德(DonaldRumsfeld)在那場名震全球的記者會上,曾經一語道破箇中奧妙:「這世上有已知的未知,也就是有些事我們知道自己不知道。但這世上還有未知的未知,也就是有些事我們不知道自己不知道。」朗斯菲德因為這句晦澀的發言而遭到大量媒體奚落,但那些批評並不公道。朗斯菲德說的不僅有道理,而且完全正確。

不過,這兩型暗數據只是開胃菜而已。下一節我們會再介紹幾型暗數據。這些和之後談到的暗數據,就是本書的全部內容。你將會明白,暗數據類型千變萬化。除非我們察覺到數據可能不完全,觀察到東西不代表觀察到全部,測量可能不準確,測量到的可能不是我們想測量的東西,否則很可能對事實狀況產生偏頗的認知。只因為沒有人在森林裡聽見樹倒了,不代表樹沒發出聲音。

你以為你有的數據就是全部?

顧客推著裝滿商品的推車來到超市結帳櫃台,掃描器逐一掃過商品條碼,收銀機一邊發出電子嗶聲,一邊加總金額,最後顧客拿到帳單,然後付帳——只不過這不是最後的結果:顧客購買的各樣商品及價格都會送到數據庫儲存起來。之後,統計學家和資料科學家會鑽研這些數據,包括顧客買了哪些商品、哪件和哪件商品一起購買,以及購買這些商品是哪類顧客,從中掌握顧客的行為樣態。這樣做肯定沒有數據遺漏了吧?超市必須掌握交易數據,才知道要收顧客多少錢,除非遇到停電、收銀機故障或有人詐騙。

感覺上,收銀機蒐集到的數據顯然就是我們能蒐集到的所有數據了。它蒐集到的不是部分交易或部分商品的資料,而是超市裡所有顧客購買的所有商品、進行的所有交易的紀錄,就像有些人說的,資料=全部(data=all)。

書籍介紹

本文摘錄自《暗數據:被看到、被聽到、被測量到的,往往不是「真凶」》,大塊文化出版

作者:大衛・漢德(David Hand)
譯者:賴盈滿

  • momo網路書店
  • Readmoo讀墨電子書
  • Pubu電子書城結帳時輸入TNL83,可享全站83折優惠(部分商品除外,如實體、成人及指定優惠商品,不得與其他優惠併用)
  • 透過以上連結購書,《關鍵評論網》將由此獲得分潤收益。

大數據時代必讀的暗數據解析大作。
「只因為沒有人在森林裡聽見樹倒了,不代表樹沒發出聲音。」
我們都習慣看向光亮之處,
但是黑暗中,看不見的事物裡,必定藏有更多決定性細節。

本書賣點

  • 《不大可能法則》作者全新著作。所謂暗數據,相當於宇宙中的暗物質、金融界的「黑池」、網路世界的「暗網」,都是不易察覺的事物,但觀察不到,不代表不存在;而觀察得到的東西,也不等於「全部」,尤其是數據。
  • 大數據就像漫畫一般,以簡單幾筆,補捉基本的輪廓,簡化了很多細節。忽略的資訊或數據可能鬧出人命、釀成災害,甚至讓經濟體、社會崩解,生命毀滅。本書揭露暗數據無所不在的事實,其成因及影響。

內容簡介

在遺漏數據的世界裡做出好決定的務實指南

身處大數據時代,不難以為我們擁有做出好決定的一切數據。但我們擁有的數據其實從未完整,甚至只取得冰山一角。就如同宇宙大部分由暗物質組成,雖然存在卻不被看見,資訊世界也充滿了暗數據,為我們所無視,非常危險。在這本《暗數據》中,數據專家大衛.漢德帶領我們踏上一趟啟發人心的精采旅程,走進我們看不見的數據的世界。

本書探討許多對於暗數據視而不見的情況,討論這些情況如何讓我們做出錯誤、危險,甚至災難性的結論與行動。作者檢視了現實生活中的例子,從挑戰者號太空梭爆炸到複雜的金融詐騙,並分享一套務實的暗數據分類法,說明這些暗數據是如何產生,以便我們學會辨別與掌控暗數據。作者不僅教導我們要對未知事物造成的問題提高警覺,也闡述如何利用暗數據,從中得益,讓我們得到更深入的理解,做出更好的決定。

如今我們所有人都仰賴數據做決定。本書將告訴我們如何避免做出壞的決定。

★暗數據無所不在,生活中有哪些事件涉及了暗數據?

  • 有人類,就有詐騙。如何辨識各種隱藏數據的詐騙手法?
  • 挑戰者號太空梭爆炸事故起因於漏掉的數據?
  • 症狀不明顯的病人容易錯過最佳治療時機?
  • 鑽漏洞與操弄制度也屬於玩弄暗數據?
  • 社群媒體讓我們覺得他人生活多采多姿,竟是暗數據的作用?
  • 選舉民調中未回覆的民眾,可能具有決定性的影響力?

本書特色

*作者出身學術界,也為金融、健康、藥學領域及政府分析大量資料,而《暗數據》結集其中精華,稱之為「消失數據」領域的專家或先驅,亦不為過。

*數據不是絕對的客觀,也非真理:本書教讀者在判讀資料時,如何避免掉進「客觀」的陷阱,對已獲取、看似可掌握的資料,保有一定的懷疑。

*展現一般人不易觀察到的統計學分析角度:這個時代一面倒地推崇大數據,沉浸在只要掌握愈多數據就無所不能的幻覺中。本書指出箇中盲點,翻轉視角,開闢另一片視野。

*深入剖析生活中實例,有閱讀驚悚推理小說的味道:作者寫作經驗豐富,以生動具條理的敘事,引導讀者進入主題。即使門外漢讀來,也會對暗數據有基本的認識。

*本書延續作者前一部作品《不大可能法則》的風格,觸及醫療、製藥、政府、社會政策、金融業、製造業等各領域的暗數據現象,揭櫫問題根本的解決之道,就在於瞭解訊息中不為人知的黑暗邊角是如何扭曲我們的認知。

暗數據
大塊文化出版

責任編輯:翁世航
核稿編輯:丁肇九