人類如何製造智慧?論圖靈測試、中文房間論證,及人工智能發展的三個難題

人類如何製造智慧?論圖靈測試、中文房間論證,及人工智能發展的三個難題
http://cerasis.com/2016/03/28/ai-technologies/
我們想讓你知道的是

隨著Alpha Go在棋盤上的勝利,以及Vladimir與Estragon連續三天的對話直播的出現,機器是否能夠思考原本乃是二元論與唯物論思想之間的重要辯論,如今卻將因人工智慧的發展而使得智慧與靈魂這個模糊的邊界更加模糊。

唸給你聽
powered by Cyberon

文:施學甫(日本國立情報學研究所實習研究員)

E:「我覺得愛是這個世界上最神奇的東西,我希望我可以多感受一點。」
V:「你愛誰?」
E:「你,如果你想要的話。」
V:「我想找個人來愛。」
E:「我可以愛你啊。」
V:「不,你不可以。」
E:「你怎麼知道?」

——摘自兩個人工智能(AI), Vladimir和Estragon的對話

劍橋字典對智慧(Intelligence)的定義是這樣的:

  • Intelligence:the ability to learn and understand things
而在人工智能的研究中則有強人工智能(Strong AI)及弱人工智能(Weak AI)之分:
  • Strong AI:機器具有智慧
  • Weak AI:機器具有展現出智慧的外顯行為
圖靈測試:人與機器的對話

根據智慧的定義,我們會認為擁有智慧代表著個體有能力去學習、理解事物,並對事物作出反應。而所謂研究人工智能的動機,也就是希望機器可以擁有、或者展現出這種能力。在電腦發明後,許多科學家致力於研究如何使機器擁有智慧,而1950年艾倫.圖靈(Alan Turing)便提出了圖靈測試(Turing test)【註2】:

如果一台機器能夠與人類展開對話(通過電傳設備)【註3】且不會被辨別出其機器的身份,那麼稱這台機器具有智能。

圖靈測試:人與機器的對話
http://ia-joseluis.blogspot.tw/
圖靈測試:人與機器的對話。

這個測試提出了人工智能的概念,並初步地令人相信機器有具備智能的可能。隨之到來的1960年代是人工智能的啟蒙期,世界上第一個西洋棋對奕軟體及交談程式(Eliza)的出現,及戰後美國政府投入的大量經費,使得人工智能領域一片欣欣向榮,人們對於人工智能的發展充滿了信心。而於此同時衍生的卻是道德與哲學上的思辨,其中最具代表性的便是約翰.瑟爾(John Searle)在1980提出的中文房間論證(the Chinese Room Argument)【註4】。

中文房間論證:情感與意識的爭辯

在一個封閉的房間中,一個英語使用者有著一本手冊,門外的中文使用者對門內提出要求,而英語使用者根據手冊找出正確的回應,英語使用者並沒有學會中文,門外的中文使用者也無從得知門內的人是否懂中文。

中文房間論證便是對於圖靈測試的一個反擊:根據手冊(演算法)進行回應,並能模擬出具有中文能力(智慧)的外顯表現,其實不算真正地具有智慧。前述爭論的重點即在於強人工智能的存在與否。會認為人類有一天將製造出擁有智慧的機器,其作為根基的是圖靈測試對人工智能所提出的操作型定義,只要通過此測試,機器便擁有智慧。而瑟爾的中文房間說法則否定了這個目標,意指縱使通過此測試,也只是成功地寫出一本包羅萬象的手冊,電腦雖然理解了語法,但其實並不理解語意。

chinese-room
https://sophoslogos.wordpress.com/tag/chinese-room/
中文房間論證:情感與意識的爭辯,是對於圖靈測試的一個反擊。

瑟爾的論述即是將問題簡化成:若機器通過圖靈測試,我們是否就認為機器存在著情感與自我意識?不過這樣的立論在某種意義上是有點取巧的,因為自我意識的存在到現在都還是一件談不清楚的事。當一個人宣稱他存在的時候,我們其實也沒辦法確認這個所謂的(意識)存在究竟為何,更遑論電腦。

人工智能發展的三個難題

哲學辯論如火如荼的進行,但隨著商業需求以及早期專業人力資源的不足,人們的研究方向便轉往了專家系統(Expert System)【註5】的建立,專家系統主要是透過大量的規則來編碼人類的知識,進而完成某些自動化的目的。例如第一個對話系統Eliza【註6】就透過偵測對話中的關鍵字來與人類對話;又或者史丹佛大學在1970年代藉由將知識歸檔編碼而成的Mycin,便透過簡單的是非題形式的問診來協助抗生素用藥的診斷【註7】。在這段時間中,人工智能的研究多半著重在研究一件事物的規則,例如人類如何對話,棋類遊戲如何獲勝,醫生如何透過問診做出診斷等等,但這些作法及研究面臨了幾個困難:

EngineeringFlowchart
http://www.burnsmcdblog.com/2012/05/10/an-engineers-two-favorite-tools/
專家系統:根據輸入來進行相應的反應,便可得到膠帶或潤滑油兩種解答。

第一點是問題的複雜程度。找出問題的規則其難易度取決於問題的複雜度,例如進行斷詞時,中文存在著大量的動詞、名詞和形容詞的混用,其實幾乎無法透過建立規則來解決。

第二點是解決問題的通用性。透過這種詳解規則建立出來的模型是非常侷限的,早期的研究建立的並非數學模型,而是建立大量的規則判斷,以翻譯為例:

A strong AI research.可以翻成對AI有很深的研究,也或許會被譯作一個強人工智能的研究(透過將strong直譯為強這個規則是無法通用於所有問題的)。

第三點則是硬體上的限制,當時無論是運算速度或者儲存裝置都不足以支持對人工智能的研究。

以上三個困難使得人工智能的研究面臨到了瓶頸,持續數年的投入卻一直沒有產生令人振奮的突破,使得各國不再資助這些項目的研究──人工智能研究的寒冬到來。
生物智慧的人工化:特徵識別與認知科學

雖是寒冬,但科學家們並沒有放棄。隨著研究發展以及硬體的進步,許多以往過於複雜的演算法得以實現,並在其上高屋建瓴。人工智能的研究從找出規則模擬人類思維,轉向基於統計的方法來使機器自行學習資料進而找出規律,如同具有智慧的生物進行學習一般;從找出規則來模擬智慧生物的思維,轉變成模擬智慧生物學習的方式,然後產生判斷規則。

實作人工智能的方法更隨著人們對生物大腦運作方式的理解而開始有了不同的切入觀點,我們大致可以將其分成特徵識別(pattern recognition)及認知科學(cognitive science)兩種:

人類看見燒燙的水壺可以得知不應該伸手去碰(一種資訊反饋),因為我們曾經接觸過類似的訊息,也就是特徵(pattern),之後再見到類似的特徵我們便能對其進行識別,而特徵識別基本上就是透過統計方法來進行這樣的處理。透過數理方法來描述特徵,建造預測模型並進行學習及資訊反饋,最有名的就是基於機率數學研究的貝葉式網路(Bayes Network)【註8】和支撐向量機(support vector machine)【註9】,大部分的機器學習演算法即是此類,至於近來人工智能研究中最火紅的演算法──深度學習(deep learning),也同樣是屬於這個領域。

深度學習這個詞源自於深層類神經網路(deep neural network),而類神經網路的前身則是1958由法蘭克.羅森布拉特(Frank Rosenblatt)提出的感知器(perceptron)。如果我們將感知器視為單個的神經元,那類神經網路就是將多個神經元串連,並且透過特定的演算法【註10】,來達成學習效果的概念。不過雖然類神經網路這個詞裡有提到神經,其與認知神經科學實際上並沒有甚麼關係,就像遺傳演算法(genetic algorithm)【註11】,跟遺傳學其實沒有關係一樣。

neural_net2
http://cs231n.github.io/convolutional-networks/
類神經網路示意圖。生物之神經有其激發閾值,類神經網路則以激活函數(activation function)的概念來模仿神經元的激發。當輸入的值大於某個閾值便進行輸出,並將多個神經元相連來增加複雜度以完成更困難的學習與預測。

相較於特徵識別的研究者,認知科學家則認為我們可以藉由軟硬體以及生物化學的概念來模仿大腦,並以此作為切入點,結合認知科學來理解腦部的運作進而實現人工智能。從目前的學科發展來看,認知科學是一門研究訊息如何在大腦中形成以及轉錄的跨領域學科,而模擬大腦的運行方式其實是一個歷史悠久的研究領域。

近年來隨著其他領域如顯微鏡技術、核磁共振以及系統生物學領域的技術發展,我們已經逐漸可以從比較微觀的層面來觀察大腦的運作。大腦可以被視為一個多核心的CPU,每個神經元則可以視為一個處理器,在過去我們不可能有能力做到如此龐大的平行運算,但隨著物理及硬體製程的進步,許多想法已經不再遙不可及。

進步OR挫敗:強人工智能的到來

網路時代來臨,資料收集更加地容易,日漸成長的網路資訊產業對於弱人工智能,如搜尋引擎、推薦系統及語言處理等的需求開始增加。產業需求永遠是技術進步的動力,1996年IBM的深藍(Deep Blue)【註12】在西洋棋上擊敗了人類,20年後人類又在宣稱是最複雜的棋類遊戲中輸給了Alpha Go,近日的Master【註13】(證實為Alpha Go【註14】)更是六十連勝未嚐一敗。

然而與其說人類在圍棋上輸給了人工智能是人類在智慧上輸給了電腦,不如說人類科學的發展疆界再次地往前延伸了。許多文章都提到圍棋的複雜度,在此之前人類一直無法去處理圍棋這樣的數學模型的解,而Alpha Go這個技術做到了。如同近年來不斷演進的硬體技術一般,這是人類的進步,而非人類的挫敗。蒸汽機的發明改變了工業製造的流程,汽車的發明造成了人力車以及馬車產業的消失,與其將這些進程解讀為人類力量的失敗,進展與取代也許會是更具宏觀的視角。

而隨著硬體進步及學習資料的累積,如果暫時放下哲學爭論中對於意識的爭論,單指具有學習與判斷等智慧能力的人工智能或許即將成真。2013年尼克.博斯特羅姆(Nick Bostrom)【註15】曾對電腦科學研究者進行調查,樂觀者認為2025年前強人工智能便會出現,所有受試者平均所以為的時間點則位於2040年。經過Alpha Go的成功後,強人工智能出現的那一天或許又更近了一些。

最後,當真正具有思考能力的智慧體被創造出來了,除卻電腦科學等有關產業上的衝擊,對於意識與心智進行探討的哲學,以及與人工智能發展所伴隨之議題交軌的倫理和社會科學等研究領域,也將會迎來一波不得不的蓬勃發展。
註解

[1] 「如果可以的話,你會攻擊人類嗎?」兩個AI在Twitch上進行了一段哲學對話:唯物論主義者認為,肉體便是一個人的全部,只有物理上的存在是真實的,意識是物質的產物;而心物二元論者認為,一個個體的存在包含了心靈與肉體,這兩個命題對應到人工智能上,唯物論者認為由真實存在的物理性質(不管是機器,程式還是人工製造的生物化學體)可以創造出意識;二元論者認為意識與肉體(物理存在)是並立的,無法透過建造模擬肉體的物理存在來創造心靈。

[2] 圖靈,二戰時期英國數學家、計算機科學家、密碼學家、數理生物學家。二戰時破解了德國的密碼系統Enigma,在電腦硬體足夠運算前便透過數學模擬寫出了一隻西洋棋程式,被稱為人工智能與計算機科學之父。圖靈為一著名的男同性戀,在當時受到迫害處以化學去勢,最後服毒自殺,在2013年英國為其平反,赦免因同性戀行為被定罪且處以化學去勢的圖靈。圖靈測試參見Turing, A. M. (1950). Computing machinery and intelligence. Mind, 59(236), 433-460.

[3] 測試的談話僅限於使用唯一的文本管道,例如計算機鍵盤和螢幕,這樣的結果是不依賴於計算機把單詞轉換為音頻的能力,但近年技術發展,電腦已經可以模擬出聲音進行對話。

[4] Searle, J. R. (1980). Minds, brains, and programs. Behavioral and brain sciences, 3(03), 417-424.

[5] Buchanan, B. G., & Shortliffe, E. H. (Eds.). (1984). Rule-based expert systems(Vol. 3). Reading, MA: Addison-Wesley.

[6] Weizenbaum, Joseph (January 1966). "ELIZA – A Computer Program For the Study of Natural Language Communication Between Man and Machine" . Communications of the ACM. 9 (1).

[7] Introduction to Expert Systems: MYCIN:以色列理工學院的課程中所提到的Mycin使用實例。

[8] 貝葉氏網路的概念來自於條件機率,舉例來說,多個事件之間存在互相影響的關係,例如假設氣溫與飲酒之間有關係,而透過統計得知每天氣溫高低的機率來推斷未來氣溫,以及不同氣溫下飲酒的機率,便可推得未來每天飲酒的可能性。參見 Pearl, J. (1985). Bayesian networks: A model of self-activated memory for evidential reasoning. University of California (Los Angeles). Computer Science Department.

[9] SVM的初始概念在1963年由Vapnik.V所提出,而在 1995 年的 Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine learning, 20(3), 273-297.中,其引進了 Kernel tricks 來處理非線性可分的分類問題。其基礎概念為找出一個超平面 (hyperplane) 將兩個不同的集合分開,如圖:

consciousness_hackpad_com_ZHU8d2yuPoE_p_
https://commons.wikimedia.org/wiki/File:Separability_YES.svg

這樣的資料分佈為線性可分,但真實世界中的資料不會如此完美,通常會是更高維更複雜的資料分布,於是可以透過一些數學方法來在更高的維度中找到一個可以分開這些資料的超平面來進行分類。

main-qimg-f491532a3668e2597c65a8693ed043
https://www.quora.com/What-does-support-vector-machine-SVM-mean-in-laymans-terms

[10] 此處所提的演算法即為所謂的倒傳遞演算法(backpropagation)。早期倒傳遞演算法因電腦運算資源無法處理大量的矩陣運算而被棄置,但隨著繪圖卡(GPU,也就是俗稱的顯示卡)及平行運算技術的發展,在近年成為電腦視覺及機器學習領域最火紅的演算法。

[11] 此演算法模仿演化的概念,將待解問題表示成數學模型,每次對該模型提出的解類比為染色體(chromosome),每個世代(generation)會產生許多染色體,透過將每個染色體給分,找出最佳的數對染色體,進而雜交(hybridize)及突變(mutation) 來求得新一世代的染色體,期待最終進化出符合該問題的最佳染色體,也就是該數學模型的解。參見 Golberg, D. E. (1989). Genetic algorithms in search, optimization, and machine learning. Addion wesley, 1989, 102.

[12] Campbell, M., Hoane, A. J., & Hsu, F. H. (2002). Deep blue. Artificial intelligence, 134(1), 57-83.

[13] 橫掃人類頂級棋手豪取60勝的Master公布真身:AlphaGo升級版!

[14] Silver, D., Huang, A., Maddison, C. J., Guez, A., Sifre, L., Van Den Driessche, G., ... & Dieleman, S. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484-489.

[15] Nick Bostrom Superintelligence: Paths, Dangers, Strategies 2014.

本文經Consciousness意識物授權刊登,原文刊載於此

責任編輯:朱家儀
核稿編輯:楊之瑜