《AI背後的暗知識》:「明知識」、「默知識」,與既不可感受也不能表達的「暗知識」

《AI背後的暗知識》:「明知識」、「默知識」,與既不可感受也不能表達的「暗知識」
Photo Credit: Shutterstock / 達志影像
我們想讓你知道的是

我們可以預見一幅未來世界的知識圖譜:所有的知識分為兩大類界限分明的知識——人類知識和機器知識。人類的知識如果不可陳述則不可記錄和傳播。但機器發掘出來的知識即使無法陳述和理解也可以記錄並能在機器間傳播。

文:王維嘉

可表達的「明知識」

目前,腦神經科學的最新研究發現,可表達的記憶並不是對應著一組固定神經元的連接,而是大致地對應於散佈在大腦皮層各處的一些連接。原因是用來表達的語言和文字只能是體驗的概括和近似。這類可以用語言表達或數學公式描述的知識就是人類積累的大量「正式知識」,也可以稱為「明知識」。它們記載在書籍、雜誌、文章、音訊等各種媒體上。要想把某種關聯表達出來,人類唯一的方法是通過語言和符號。語言和符號表達的第一個前提是要有概念。所謂概念就是某個特定的發音或符號穩定地對應於一個事物或行為。大部分的名詞和動詞都是這樣的概念。第二個前提是每個概念都不同於其他概念,貓就是貓,狗就是狗,不能把貓叫成狗,或者把狗叫成貓,兩者要能區分開。這叫「同一律」。第三個前提是貓不能同時也不是貓,黑不能同時也是白。這叫「不矛盾律」。

有了這些基本前提,根據已知的事物間的關係我們就可以推導出新的知識或者論證一個決定的合理性。推理、假設、聯想,這些本質上都是建立在語言之上的思維活動,沒有語言就完全無法思維。所有的正常思維都要借助概念,要遵循「同一律」和「不矛盾律」。語言是人類和所有動物的最大區別。黑猩猩可以學會很多概念,譬如「我」「吃」和「香蕉」等,但無論實驗人員如何訓練黑猩猩,它們都無法組合出「我要吃香蕉」這樣的句子。人的語言能力的本質是什麼? 它的生物學基礎是什麼? 語言和自我意識是什麼關係? 目前這些都還不清楚。但我們知道,人類語言是不精確的,越基本的概念越不容易定義清楚,像「公平」「理性」等。人類語言中有大量含混和歧義的表述,像「今天騎車子差點滑倒,幸虧我一把把把把住了」。

英國哲學家羅素企圖把語言建立在精確的邏輯基礎之上,他用了幾百頁紙的篇幅來證明1+1=2。德國哲學家維特根斯坦(Ludwig Wittgenstein,1889~1951)認為人類有史以來幾乎所有的哲學辯論都源於語言的模糊不清,因而沒有任何意義。他認為在世界中只有事實有意義,在語言中只有那些能夠判斷真偽的論斷才能反映事實。他的結論是:我們的語言受限,因而我們的世界受限。

為什麼語言的表達能力受限? 用資訊理論的方法可以看得很清楚。我們大腦接收的環境訊息量有多大?一棵樹、一塊石頭、一條狗都包含幾十MB(百萬位元組)甚至幾十GB(千百萬位元組)的數據,我們的感覺接收神經元雖然大大簡化了這些資訊,但它們向大腦傳導的訊息量仍然非常大,表1.1是各個感覺器官每秒鐘能向大腦傳遞的訊息量。

AI背後的暗知識P40
Photo Credit: 大寫出版

大腦存儲這些資訊的方式是神經元之間的連接,大腦在存儲時可能進一步簡化了這些資訊,但它們的訊息量仍然遠遠大於我們語言所能表達的訊息量。人類語言的最大限制是我們的舌頭每秒鐘只能嘟嚕那麼幾下,最多表達幾十個比特的意思。(比如讀書,我們平均每分鐘能讀300字,每秒讀5個字=40比特。)這樣大腦接收和存儲的資訊與能用語言表達出來的訊息量就有六個數量級的差別。也就是說極為豐富的世界只能用極為貧乏的語言表達。許多複雜事物和行為只能用簡化了的概念和邏輯表達。這就是人類語言的基本困境。

只可意會的「默知識」

由於舌頭翻卷速度嚴重受限,以神經元連接形式存在大腦中的人類知識只有極少一部分可以被表達出來。而絕大部分知識無法用語言表達,如騎馬、打鐵、騎自行車、琴棋書畫,察言觀色、待人接物、判斷機會和危險等。這些知識由於無法記錄,所以無法傳播和積累,更無法被集中。英籍猶太裔科學家、哲學家波蘭尼(Michael Polyani,1891~1976)稱這些知識為「默會知識」或者「默知識」。

波蘭尼舉了騎自行車的例子。如果你問每個騎自行車的人是怎麼保持不倒的,回答會是「車往哪邊倒,就往哪邊打車把」。從物理學上可以知道,當朝一個方向打把時會產生一個相反方向的離心力讓車子平衡。甚至可以精確計算出車把的轉彎半徑應該和速度的平方成反比。但哪個騎自行車的人能夠知道騎車的速度呢? 即使知道誰又能精確地把轉彎半徑控制在速度平方的反比呢? 所有騎自行車的人都是憑身體的平衡感覺左一把右一把地曲折前進。世界上大概沒有一個人學騎自行車是看手冊學會的,事實上也沒有這樣的學習手冊。大部分技能類的知識都類似。默知識和明知識主要有以下四點區別:

(1)默知識無法用語言和文字描述,因此不容易傳播,無法記錄和積累,只能靠師傅帶徒弟。像大量的傳統工藝和技能,如果在一代人的時間裡沒人學習就會從歷史上徹底消失。

(2)獲取默知識只能靠親身體驗,傳播只能靠人與人之間緊密的互動(你第一次騎自行車時你爸在後面扶著)。而這種互動的前提是相互信任(你不敢讓陌生人教你騎自行車)。獲得默知識必須有反饋回路(騎自行車摔了跤就是姿勢錯了,不摔跤就是姿勢對了)。

(3)默知識散佈在許多不同人的身上,無法集中,很難整合,要想使用整合的默知識需要一群人緊密協調互動。由於無法言傳,所以協調極為困難(比如雜技疊羅漢)。

(4)默知識非常個人化。每個人對每件事的感覺都是不同的,由於無法表達,因而無法判斷每個人感覺的東西是否相同。

基於對默知識的理解, 奧地利經濟學家哈耶克(Friedrich Hayek,1899~1992)論證了市場是最有效的資源配置形式。因為市場上的每個人都有自己不可表達的、精微的偏好和細膩的需求,而且沒人能夠精確完整地知道其他人的偏好和需求,也就是說供需雙方實際上無法直接溝通。供需雙方最簡潔有效的溝通方式就是通過商品的價格。在自由買賣的前提下,市場中每個人只要根據價格信號就可以做出決定。價格可以自動達到一個能夠反映供需雙方偏好和需求的均衡點。一個價格數字,就把供需雙方的無數不可表達的資訊囊括其中。這種「溝通」何其簡潔,這種「協調」何其有效,這種自發形成的秩序何其自洽。哈耶克根據同樣的道理論證了國家或政府永遠都無法集中這些不可表達的分散訊息。

在機器學習大規模使用之前,人類對於默知識沒有系統研究。但現在我們發現機器非常擅長學習默知識。這就給我們提出了三個嚴肅的問題。

(1)默知識在所有知識中占比有多大?

(2)默知識在人類社會和生活中有多大用處?

(3)如何使用默知識?

第一個問題的簡單粗暴的回答是默知識的量遠遠大於可陳述的明知識。原因是事物的狀態很多是難以觀察的,更多是不可描述的。人類的描述能力非常有限,只限於表達能力極為有限的一維的語言文字。在所有已經產生的資訊中,文字只占極少的比例,大量的資訊以圖片和影片方式呈現。人類現代每年產生的各種文字大約是160TB。世界最大的美國國會圖書館有2000萬冊書,幾乎涵蓋了人類有史以來能夠保存下來的各種文字記錄,就算每本書有100萬字,這些書的總訊息量也只有20TB。而目前用戶每分鐘上傳到YouTube的影片是300小時,每小時影片算1GB,每年上傳的量就是157680TB。如果把每個人手機裡的影片都算上,那麼影片資訊是文字資訊的上億倍。今後這個比例還會不斷加大。雖然這些影片或圖片都是「資訊」,還不是「知識」,但我們也可以想像從影片圖片中能提取出的隱藏的相關性的量一定遠遠大於所有的文字知識。

有了第一個問題的答案,就容易回答第二個問題。很顯然,用機器學習從影片和圖片中萃取知識是人類認識世界的一個新突破,只要有辦法把事物狀態用圖片或影片記錄下來,就有可能從中萃取出知識來。如果影片和圖片的訊息量是文字的上億倍,那麼我們有理由期待從中萃取出的知識呈爆炸式增長,在社會和生活中起到關鍵甚至主導作用。人工智慧通過觀看大量人類歷史上的影視作品,可以歸納提取出影視中的經典橋段,創作出新穎的配樂、臺詞和預告片,供人類借鑒或使用。

2016年,IBM(國際商業機器公司)的沃森系統為二十世紀福克斯電影公司的科幻電影《摩根》(Morgan)製作了預告片。IBM的工程師們給沃森看了100部恐怖電影預告片,沃森對這些預告片進行了畫面、聲音、創作構成的分析,並標記上對應的情感。它甚至還分析了人物的語調和背景音樂,以便判斷聲音與情感的對應關係。在沃森完成學習後,工作人員又將完整的Morgan電影導入,沃森迅速挑出了其中10個場景組成了一段長達六分鐘的預告片。在沃森的幫助下,製作預告片的時間由通常的10天到1個月,縮減到了短短的24個小時。同樣道理,機器學習可以從海量的生態、生產和社會環境資料中萃取出大量的未曾發現的知識。

第三個問題最有意思。由於機器萃取出的知識是以神經網路參數集形式存在的,對人類來說仍然不可陳述,也很難在人類間傳播。但是這些知識卻非常容易在機器間傳播。一台學會駕駛的汽車可以瞬間「教會」其他100萬台汽車,只要把自己的參數集複製到其他機器即可。機器間的協同行動也變得非常容易,無非是用一組回饋信號不斷地調整參加協同的每台機器的參數。

如果用一句話總結默知識和明知識的差別那就是波蘭尼說的:We know more than we can tell(知道的遠比能說出來的多)。

明知識就像冰山浮出水面的一角,默知識就是水下巨大的冰山。這兩類知識也包括那些尚未發現的知識,一旦發現,人類要麼可以感受,例如第一個登上珠峰的人能感受到缺氧;要麼從理性上可以理解,例如看懂一個新的數學定理的推導過程。

既不可感受也不能表達的「暗知識」

既然可以感受(但不可表達)的是默知識,可以表達的是明知識,那麼機器剛剛發現的,既無法感受也無法表達的知識就是暗知識。我們用是否能感受作為一個坐標軸,用是否能表達(或描述)作為另一個坐標軸,就可以用圖1.3把三類知識的定義清晰地表達出來。在這張圖裡,明知識又被分為兩類:第一類是那些既可以感受又可以表達的,例如浮力定律、作用力反作用力定律等。第二類是不可感受可以表達的,如大部分的數學以及完全從數學中推導出來但最後被實驗驗證了的物理定律,以及相對論和量子力學。

AI背後的暗知識P45
Photo Credit: 大寫出版

為了理解暗知識的本質,我們必須先搞清楚「知識」與我們今天常用的「資訊」和「資料」有什麼不同。稍加研究就能發現關於資訊、資料和知識的定義有很多並且非常混亂。筆者在下面給出一組符合資訊理論和腦神經科學研究結果的簡單而自洽的定義。資訊是事物可觀察的表徵,或者說資訊是事物的外在表現,即那些可觀察到的表現。在我們沒有望遠鏡時,談論肉眼以外星空裡的資訊毫無意義。

資料是已經描述出來的部分資訊。任何一個物體的訊息量都非常大,要想精確地完全描述一塊石頭,就要把這塊石頭裡所有基本粒子的狀態以及它們之間的關係都描述出來,還要把這塊石頭與周圍環境和物體的關係都描述出來。而關於這塊石頭的資料通常則少得多,例如它的形狀、重量、顏色和種類。

知識則是資料在時空中的關係。知識可以是資料與時間的關係,資料與空間的關係。如果把時間和空間看作資料的一部分屬性,那麼所有的知識就都是資料之間的關係。這些關係表現為某種模式(或者說模式就是一組關係)。對模式的識別就是認知,識別出來的模式就是知識,用模式去預測就是知識的應用。開普勒的行星運動定律就是那些觀測到的資料中呈現的時空關係。牛頓定律的最大貢獻可能不在於解釋現有行星的運動,而在於發現了海王星。這些資料在時空中的關係只有在極少數的情況下才可以用簡潔美妙的數學方程式表達出來。在絕大多數情形下,知識表現為資料間的相關性的集合。這些相關性中只有極少數可以被感覺、被理解,絕大多數都在我們的感覺和理解能力之外。

人類的理解能力由感受能力和表達能力組成。人類的感受能力有限,局限性來自兩個方面。一是只能感受部分外界資訊,例如人眼無法看到除可見光之外的大部分電磁波頻譜,更無法感受大量的物理、化學、生物和環境資訊。一是人類的感官經驗只局限在三維的物理空間和一維的時間。對高維的時空人類只能「降維」想像,用三維空間類比。對於資料間的關係,人類憑感覺只能把握一階的或線性的關係,因為地球的自轉是線性的,所以「時間」是線性的。例如當我們看到水管的水流進水桶裡時,水面的上升和時間的關係是線性的,我們憑感覺可以預測大概多長時間水桶會滿。人類感官對於二階以上的非線性關係就很難把握。例如當水桶的直徑增加一倍時,水桶能盛的水會增加四倍,這點就和「直覺」不相符。

人類的表達能力只限於那些清晰而簡單的關係,例如少數幾個變數之間的關係,或者是在數學上可以解析表達的關係(「解析表達」的意思就是變數之間的關係可以用一組方程式表達出來)。當資料中的變數增大時,或當資料間的關係是高階非線性時,絕大多數情況下這些關係無法用一組方程式描述。所以當資料無法被感受,它們之間的關係又無法用方程解析表達時,這些資料間的關係就掉入了人類感官和數學理解能力之外的暗知識大海。

我們現在可以回答「一個人類無法理解的暗知識的表現形式是什麼樣的」,暗知識在今天的主要表現形式類似AlphaGo Zero裡面的「神經網路」的全部參數。在第三章詳細介紹神經網路之前,我們暫時把這個神經網路看成一個有許多旋鈕的黑盒子。這個黑盒子可以接收資訊,可以輸出結果。黑盒子可以表達為一個一般的數學函數:Y=fw(X)。這裡Y是輸出結果,fw(X)是黑盒子本身,X是輸入資訊,w是參數集,就是那些旋鈕,也就是暗知識。

我們如何知道這個函數代表了知識,也即這個函數有用?這裡的判別方法和現代科學實驗的標準一樣:實驗結果可重複。對AlphaGo Zero來說就是每次都能贏;用嚴格的科學語言來說就是當每次實驗條件相同時,實驗結果永遠可重複。讀完第三章,讀者就會從細節上清楚暗知識是如何被驗證的。

注意,暗知識不是那些人類尚未發現但一經發現就可以理解的知識。比如牛頓雖然沒有發現相對論,但如果愛因斯坦穿越時空回去給他講,他是完全可以理解的。因為理解相對論用到的數學知識如微積分牛頓都有了。即使在微積分產生之前,如果愛因斯坦穿越2000年給亞里斯多德講相對論,亞里斯多德也能理解,至少能理解狹義相對論背後的物理直覺。但如果給亞里斯多德講量子力學他就不能理解,因為他的生活經驗中既沒有薛定諤的貓(用來比喻量子力學中的不確定性,一個封閉的盒子裡的貓在盒子沒打開時同時既是死的也是活的,一旦打開盒子看,貓就只能有一種狀態,要麼是死要麼是活),他的數學水準也無法理解波動方程。那麼我們可以說對亞里斯多德來說,量子力學就是暗知識。量子力學因為沒有經驗基礎,甚至和經驗矛盾,在剛發現的初期,幾乎所有的物理學家都大呼「不懂」,至今能夠透徹理解的人也極少。甚至連愛因斯坦都不接受不確定性原理。

人類過去積累的明知識呈現出完美的結構,整個數學就建立在幾個公理之上,整個物理就建立在幾個定律之上,化學可以看成是物理的應用,生物是化學的應用,認知科學是生物學的應用,心理學、社會學、經濟學都是這些基礎科學的應用組合。這些知識模組之間有清晰的關係。但是機器挖掘出來的暗知識則像一大袋土豆,每個之間都沒有什麼關係,更準確地說是我們不知道它們之間有什麼關係。

我們可以預見一幅未來世界的知識圖譜:所有的知識分為兩大類界限分明的知識——人類知識和機器知識。人類的知識如果不可陳述則不可記錄和傳播。但機器發掘出來的知識即使無法陳述和理解也可以記錄並能在機器間傳播。這些暗知識的表現方式就是一堆看似隨機的數位,如一個神經網路的參數集。這些暗知識的傳播方式就是通過網路以光速傳給其他同類的機器。

暗知識給我們的震撼才剛剛開始。從2012年開始的短短幾年之內,機器已經創造了下面這些「神蹟」:對複雜病因的判斷,準確性超過醫生;可以惟妙惟肖地模仿大師作畫、作曲,甚至進行全新的創作,讓人類真假難辨;機器飛行員和人類飛行員模擬空戰,百戰百勝。

我們在第六章會看到更多這樣的例子。人類將進入一個知識大航海時代,我們將每天發現新的大陸和無數金銀財寶。我們今天面對的許多問題都像圍棋一樣有巨大的變數,解決這些問題和圍棋一樣是在組合爆炸中尋求最優方案,例如全球變暖的預測和預防、癌症的治癒、重要經濟社會政策的實施效果、「沙漠風暴」這樣的大型軍事行動。系統越複雜,變數越多,人類越無法把握,機器學習就越得心應手。無數的機器將不知疲倦地晝夜工作,很快我們就會發現機器新發掘出來的暗知識會迅速積累。和下圍棋一樣,暗知識的數量和品質都將快速超過我們在某個領域積累了幾百年甚至幾千年的知識。明知識就像今天的大陸,暗知識就像大海,海平面會迅速升高,明知識很快就會被海水包圍成一個個孤島,最後連聖母峰也將被淹沒在海水之下。

這場人類認知革命的意義也許會超過印刷術的發明,也許會超過文字的發明,甚至只有人類產生語言可與之相比。請繫好安全帶,歡迎來到一個你越來越不懂的世界!

書籍介紹

本文摘錄自《AI背後的暗知識:機器如何學習、認知與改造我們的未來世界》,大寫出版

*透過以上連結購書,《關鍵評論網》由此所得將全數捐贈聯合勸募

作者:王維嘉

沒人能逃離人工智慧+機器學習的巨大力量:
今天的機器已不斷探索出那些隱藏在海量資訊中的相關性,以及萬事萬物間的隱蔽關係。
這些人類既無法感受,也無法描述與表達的「暗知識」,將徹底重塑世界!

深刻理解AI的本質,就能對未來更有方向感
人工智慧很可能導致一場人類社會舊秩序的永久性改變,而這一切或許會比所有人想像的更快發生。

如果你留意最近幾年科技的發展,你會發現,到處都暗示著我們對於生存的認知將被下一階段的發展而徹底改變。

在這本由一位人工智慧參與者/矽谷風投家親撰、題旨宏大卻又簡練解釋了當前科技進程的書中指出,人類或許永遠能自知「所知有限」,但AI與機器學習的出現,則讓我們進入了一個全新的未來領域。作者主張:

「我們可以預見一幅未來世界的知識圖譜:所有的知識分為兩大類界限分明的知識:人類知識和機器知識。人類的知識如果不可陳述則不可記錄和傳播。但機器發掘出來的知識即使無法陳述和理解也可以記錄並能在機器間傳播。這些『暗知識』的表現方式就是一堆看似隨機的數位,如一個神經網路的參數集。這些暗知識的傳播方式就是通過網路以光速傳給其他同類的機器。」

「暗知識給我們的震撼才剛剛開始。從2012 年開始的短短幾年之內,機器已經創造了下面這些「神蹟」:對複雜病因的判斷,準確性超過醫生;可以唯妙唯肖地模仿大師作畫、作曲,甚至進行全新的創作,讓人類真假難辨;機器飛行員和人類飛行員模擬空戰,百戰百勝。……人類將進入一個知識大航海時代,我們將每天發現新的大陸和無數金銀財寶。」

過去人們總把人工智慧(AI)當成科幻電影中才會出現的情景,可近年來不斷有人嚴肅的討論這個問題,同時也讓我們感到困惑,由於我們總把人工智慧跟虛構的電影情節連想在一起,也可能是人工智慧可以用來的描述事物太多了,從電子計算機、自動駕駛車到智慧醫療,它已經存在於我們生活中了,可是它到底是什麼?

這本書就將告訴你目前所謂的人工智慧是什麼?AI背後許多聽來極度專業又帶有資訊工程最前瞻性的工具及技術,如機器學習/卷積網路/深度學習等,到底能不能用簡單方式說明白?

本書也是一本寫給一般人及非資訊科學專業人士得以理解AI全局的定義性讀物,作者師從人工智慧的學術大師伯納德.威羅,並企圖以知識的概念——「內隱知識」為比喻出發,帶領讀者了解目前AI正在攻堅的方向,這些人類過去僅能靠想像存在的「聰明機器」是如何學會了人類世界過去無法有效解決的治理需求,它們的背後有何「暗知識」使得機器得以靠傳感器、物聯網累積的大量資訊及新的機器學習工具做出比人類更卓越、有如神蹟般的表現?

看完本書,你將了解:AlphaGo為何得以戰勝人類最傑出的圍棋棋士,而且也將在某些事物上更長期的占據「人機對奕」的優勢。本書同時也要解答:

  • AI應用的「暗知識」會對經濟與社會造成哪些直接衝擊?
  • 機器學習如何從資料中挖掘暗知識?
  • 機器認知將顛覆什麼行業,不同行業裡又有哪些新的投資機會和陷阱?
  • 神經網路的基本工作原理與當前最接近商業應用的形態
  • AI對哪些行業的衝擊已經或即將發生?哪些行業的AI應用則在目前看不到「取代性」的可能?
  • AI對人類管理的城市與社會將顛覆性的改變有哪些?
  • ……以及最重要的,你我對這個「許多事務都將由機器治理接管」的時代,該如何因應與準備?
getImage
Photo Credit: 大寫出版

責任編輯:翁世航
核稿編輯: