《棋士與AI》:人類棋士和AlphaGo究竟哪裡不同?故事性正是圍棋的醍醐味

《棋士與AI》:人類棋士和AlphaGo究竟哪裡不同?故事性正是圍棋的醍醐味
Photo Credit: fsbraun, pixabayCC0 Public Domain
我們想讓你知道的是

人類棋士其實主要是依據「故事性」,也就是以棋局致此的發展(故事),來對局面做出判斷。但AI的判斷如同絕對音感,和過往的故事沒有關聯,能對當下的局勢本身做出正確判斷。

唸給你聽
powered by Cyberon

文:王銘琬

人類棋士和AlphaGo究竟哪裡不同呢?有許多人從下棋手法的差異去觀察,不過只從手法的差異,並沒有辦法看出本質上的差異。

差異在於下棋所需的「基本體力」

首先必須理解人類下棋所需的「基本體力」——也就是計算力、反應能力和腦細胞思考的速度等,人類棋士和AlphaGo的最大差別其實就在這裡。這些能力都遠高於人的電腦再加上深層學習的成果,它的先天條件是完全不一樣的。因為至今會下棋的只有人類,習慣性地以人類的能力為準來看AlphaGo的話,自然會為它的伎倆所震撼,但「基本體力」比人類要強太多的AlphaGo,下出與人類不同的棋是理所當然的。比方說,讓能7秒就跑完百米,握力高達300公斤的機器人來打棒球的話,從投球的動作、打擊的姿勢以至於守備的位置等,比起人自然都會有很大的不同。人們很容易看見這些表面現象的不同(投球動作、打擊姿勢、守備位置等),並從這些差異獲得解答與教訓;然而這些差異雖也有一些參考價值,根本的原因還是在於基本體力相差太遠。

AlphaGo已經到達可以讓人類三子的程度。這個差距,差不多就是頂尖棋士與日本縣市圍棋冠軍的差距.若這些縣市冠軍來講評頂尖棋士的棋譜,從棋士看來沒什麼好當真,只會覺得「信口開河也是滿開心的」。我們評論AlphaGo的棋技時也是如此,雖對AlphaGo做評論,其實只是在闡述自身的圍棋觀而已。

AlphaGo在李世乭戰取得勝利之後,仍然不斷改善精進,一年後的柯潔戰時,它的作戰與手法已經截然不同。不用說與人類下法的差異,同樣是AlphaGo,在不同時點下的棋也會不一樣。所以只從下法的不同去觀察,是沒辦法悟出什麼道理的。關於AlphaGo的棋技,只要理解它與人類的基本體力的差異就夠了,把焦點放在每一手棋上面,會變成分析圍棋本身的技術,反而會迷失本質;前一章節提及的,想要理解AlphaGo的棋,直接看它的內部資料才是最好的方法。

過程與內容是差異所在

判斷、計算、選擇最佳著手,這些要件在AlphaGo與人類棋士之間,尚有共通點存在。然而人類畢竟是生物,下棋時很多的要素和過程,和AI是不一樣的。這些不同,包含了身為人類才能擁有的內容。

雖然我們跑得比AI慢,為了要在10秒內跑完100公尺,我們必須吃東西,也必須保持積極的精神狀況。人類為了克服身體條件的極限,開發出許多提升紀錄的技巧,並且傳承給下一代的運動員。雖然對七秒跑完一百公尺的機器人來說毫無意義,卻是人類貴重的財產。克服與生俱來的生理制限,其過程以及成果,不就是人類的歷史與文化?

AI和人類的思考脈絡不同,著眼點也不同。這些差異有些來自於AI和人類能力的不同,有些源於機器和生物原有的差別。本章將從幾個不同的角度來觀察。

事物的背後需要故事性嗎?
圍棋如同語言

所謂「思考」,是由語言進行的,而不用語言則無法思考——記得小時候,我是這麼學的。然而下棋時決定下一手棋的過程若是「思考」的話,就會牴觸上述的說法。對局者想必不覺得自己是運用言語去思考次一手,而不只職業棋士是如此吧?因為圍棋若是用「如果我這麼下,對方大概會如此應」這般的語言方式去思考的話,根本太花時間了。圍棋的判斷與算棋,應該是在化為言語之前,直接在棋盤上運作的;不過這不代表圍棋世界和語言沒有關係,我認為下棋的人,是將局面,也可說是局面所代表的意義,直接當作語言來運用。

這樣的「準語言」,無需和他人溝通,其中的「文法」或許也只有當事人自己才懂。但因為「思考」的妥當性會立刻在實際棋盤上受到檢驗,它的邏輯該是還算站得住腳的吧!因為有「棋盤」作為共通的基礎,單憑「準語言」就十分管用。圍棋又被稱為「手談」,對弈雙方可以用準語言的「圍棋語」在棋盤上進行對話。曾聽過「因為兩台AI突然用人類所無法理解的語言開始交談,只好趕緊拔掉插頭」的軼事,從圍棋來看就知道,這是很可能發生的。

人類以「故事性」作為判斷依據

人類的每一手棋就像是一個「語彙」,代表單一或複數的意義。每一局棋平均會下兩百手,這麼多的「語彙」有意義地串連在一起,就像是一篇散文了。雙方的每一手棋,都會展現出彼此的看法,可說是圍繞著棋盤所進行的「辯論賽」。像是「如果踏進我的勢力範圍,你就等著瞧」,對方也會回應「你渾身上下都是破綻,還敢這麼囂張啊」,這樣的激辯會持續到分出勝負為止;透過你來我往的主張引起不同局面的發展,形同一個「故事」;如果說一局棋是一個故事,每一手棋就是其中的章節,而一手棋的背後又可能隱含著另一個故事。

每一個局面,有它至此的發展與議題,其後的展望與選項、分歧等,都是迷人的小故事;圍棋最難的地方莫過於判斷情勢;「故事」不但留下過程的紀錄,也能指引未來的方向,對於人類來說「故事」是線索的寶庫,以做出自己願意接受的判斷。

從另一個角度而言,對弈是兩種圍棋觀的衝撞。對局者各有不同的情節喜好,雖在同一個棋盤上,但各自描繪不同的故事,為它們的合理性打拚;圍棋可說是迫使對手認同自己的圍棋觀,認同自己編的故事的遊戲。

AI的判斷如同「絕對音感」

然而AI所下的棋和所謂的故事性無關,只對於目前的狀況做出機械式的判斷,再透過機械性的過程決定下一手棋。人類棋士其實主要是依據「故事性」,也就是以棋局致此的發展(故事),來對局面做出判斷。但AI的判斷如同絕對音感,和過往的故事沒有關聯,能對當下的局勢本身做出正確判斷。

雖然被稱為天才的人,可能比較會做出這般「絕對判斷」,但不過是和其他人類相較的層次。將棋棋士羽生善治曾表示「將『人生』帶進將棋世界中,只會讓想法流於姑息」,這句話告訴我們客觀角度的重要性,然而我們也曾聽到他說,有時會採取「此局面可以假設,應該有這種下法」;類似的想法在圍棋常會用上,它的意思是「如果我至今的方向是正確的,此後的真實之路就必是如此」,正是將「故事性」發揮到極致的判斷方法。

「故事性」所指的是人們對所觀察的事物賦予定義。比起光憑眼前單純地去理解,人類更傾向找出其中的特徵,判斷前因後果,賦予定義,讓自己更容易理解各種事物。

AI不拘泥於故事性

因為目前AI將認知直接加以處理,就能得到過人的能力,所以不需要做其他輔助認知的措施。我所感受到的人類和AI最大的差別,就在於有沒有「故事性」。

圖1 「Master」在開頭的布局就使出白3,讓全世界的職業棋士都跌破眼鏡。這個手段被稱為「刺」,日語是「ノゾキ(覗)」有「偷窺」的意思。看圖就能理解,白3一子從兩個黑棋子的空隙「偷窺」到左邊。

圖2 「刺」之後,假使白棋能如圖再下白1的話,黑棋將被完全分裂。

圖3 所以,對於白1刺,黑棋大概會用黑2的「接」來回應白3。同樣顏色的棋子在線上連結起來就連成一體,三個黑棋這樣就會非常穩固。反過來也可以想成,如果白1刺的話,黑棋大概會黑2接。

P98_1
Photo Credit: 大塊文化提供

圖4 對於最初的白1,黑棋要像剛才一樣下在A的位置,或是像此圖下在旁邊的黑2,這是長久以來讓職業棋士傷透腦筋的大問題。

圖5 如果下在黑1,雖然能對白A施壓,可是這樣一來被白2夾之後,留有從相反方向的白B「刺」的手段,這也是人類所顧忌的,黑1這手棋最大的弱點。

圖6 所以我們可以知道,如果AlphaGo下掉白1的「刺」,就會失去圖5,從另一側施展攻勢的機會,削減了夾擊的威脅度;對黑棋來說,不必擔心被白A夾擊,會變得更好下。

P99_1
Photo Credit: 大塊文化提供

因為白1的「刺」伴隨著不利因素,對人類棋士來說,這是「緊要關頭」時才會下的一手。比如這一帶進入白刃戰的時候,如果很明顯地此點需要白子,才會施出白1這個手段。如同水戶黃門(譯註:水戶藩第二代藩主德川光圀,微服出巡、行俠仗義的民間傳說故事深植人心),在懲戒惡徒的重要關頭才亮出的葵紋印籠;對人類來說,白1是在「必要時」才會去下的一手。然而AlphaGo的「Master」版本卻在比賽一開始就使出這招,如同旅行中的水戶黃門,在路邊的茶館稍事休息的時候,竟然輕易亮出印籠,讓人類大吃一驚。

其實在AlphaGo和李世乭對弈的賽局中,AlphaGo已經以「刺」的招數,震驚世界了。

圖7 AlphaGo所下的黑1「刺」,是當時的人類棋士從來沒想過的一手。因為此圖就算A夾威脅也不大,比起來「刺」的缺點較少。但是在當時的觀眾眼中,這一手也像水戶黃門隨便亮出印籠一樣,是一手壞棋。

P100_1
Photo Credit: 大塊文化提供

對於人類棋士而言,就算使用「刺」的缺點不那麼明顯,也會覺得有害無利,所以如同圖6的手法,等於自己去補強對方的弱點,想都不會去想,一般的棋士不可能會選擇這樣做。對於人類所詮釋的「圍棋故事」,「刺」就如同水戶黃門的印籠,只有在關鍵時刻,被賦予特別意義時才會出動,一開始就把它亮出來不會有任何意義。在思考這步棋究竟是好是壞之前,它在人類圍棋故事中的定位就是如此,因此不會成為次一手的選項。

AlphaGo最初也是透過人類的棋譜學習圍棋,不過像這樣從序盤開始就採用和人類的圍棋故事截然不同的下法,正是AlphaGo自我對戰學習的成果。因為這手棋有AlphaGo的驗證,可能「比以往的下法還要好一些」,職業棋士現在也開始嘗試這樣的下法。

然而,由於人類的圍棋還是有著自己的故事,就算仿效了AlphaGo一手棋,不知道後續的故事該如何發展下去,總體來說不會造成加分效果。

圖8 所以人類棋士下白1「刺」的話,接下來幾乎都會選擇白3飛。因為此圖A的位置對雙方非常重要,但黑棋下在A的話,白1與黑2的交換,讓黑棋的棋形過分凝聚,對於白棋來說反而成為加分的因素。從人類角度看來,如此的「故事發展」相當合理。AlphaGo在實戰中並沒有下白3,但對於人類來說,這樣下才能讓「刺」這手棋在棋局故事中發生意義,以構思此後的作戰。

P101_1
Photo Credit: 大塊文化提供
故事性正是圍棋的醍醐味

AlphaGo最初學習人類棋譜之際,也學習至此局面為止的十手棋之發展流程。可說AlphaGo亦學習人類圍棋背後的「故事性」,對於人類的「圍棋脈絡」有所認知。其後經過各種學習,逐漸逸脫人類的思考方式,打造出「AlphaGo自己的圍棋」。

AlphaGo在算棋的過程中,必須有前後的因果關係,也會隨著局勢變化打出安全牌,可說有自己的棋路。但人類為各種要素賦予定義,在不同發展脈絡下詮釋出不同的故事,藉以判斷情勢,決定戰術的方式,和AlphaGo是完全不同的。

作為人類判斷的基礎的「故事性」,是以人類的觀點、感覺為基準,對各項事物賦予定義,為事物彼此的關聯做解釋;因為一切以人類主觀的感性為基準,正確性自然無法那麼理想。但人類無法為了追求正確而捨棄故事性與主觀認知,因為那是經過進化長時間的驗證,才形成的對人類最有利的方法。「地表最快速男人」尤山.波特,100公尺的世界紀錄只不過9.58秒,無論如何比不上用7秒就能跑的機器人;感受各種局面中的「故事性」,由此促進理解,也是人類的宿命,只要我們身為人類,就無法跳脫「故事性」和「主觀的判斷」。找到自己的故事,加以演繹詮釋,正是人類悠遊於圍棋世界中不可或缺的極品的醍醐味。

書籍介紹

本文摘錄自《棋士與AI:AlphaGo開啓的未來》,大塊出版
*透過以上連結購書,《關鍵評論網》由此所得將全數捐贈兒福聯盟

作者:王銘琬
譯者:林依璇

AlphaGo 的登場,
迫使我們必須重新思考、認識整個世界;
棋士與AI、人與人之間都需要重新對話與邂逅,
讓我們從理解AlphaGo 來開始吧!

目前AI的最高到達點是圍棋,在圍棋發生的情況,所有其他領域也必將面臨。

Google旗下的Deep Mind公司為圍棋世界帶來前所未有的衝擊。AlphaGo發展至今,已達成戰勝世界頂尖棋士的目標。而開發AlphaGo的Google公司,也將帶領AlphaGo進一步從棋盤走向社會。面對AlphaGo帶來的變化,首當其衝的知名職業棋士,正是當時唯一參與圍棋軟體開發的職業棋士,55、56期本因防王銘琬。他眼中的AlphaGo,究竟是何種面貌呢?AI的活躍、AI和人類的相遇、最新的技術革新和資訊,以及如何享受圍棋世界的樂趣等等,重大的改變和議題隨之而來,在面臨新的挑戰之際,人類也要開始認真思考「如何面對AI」。

AI與圍棋相遇的種種現象,在AlphaGo塵埃落定、AI走向社會後,也將發生在所有領域,而唯有本書作者能藉著少量的分析圖,為讀者呈現AI、圍棋與其他領域的關聯與內涵,即使不會下棋也可以輕鬆閱讀。

「我身為棋士,參與軟體開發,得以站在一個特別的角度觀察AlphaGo。AI浪潮席捲人類社會,並進一步融入我們所在的這個世界。儘管一開始人們可能會受到衝擊,感到無所適從,但AI的發展也是讓我們重新檢視自己的好機會……」

getImage
Photo Credit: 大塊文化

責任編輯:潘柏翰
核稿編輯:翁世航

或許你會想看
更多『評論』文章 更多『科學』文章 更多『精選書摘』文章
Loader