AlphaGo下的棋看不懂?「空壓法」或許可以成為我們理解AI圍棋的切入口

AlphaGo下的棋看不懂?「空壓法」或許可以成為我們理解AI圍棋的切入口
Photo Credit: Reuters/達志影像

我們想讓你知道的是

圍棋知識至今是由局部的探討開始,像積木般的架構全局,而空壓法是跳開局部,一開始就以全局的命題為首要目標,這也是與AI共通的因素。用空壓法去觀察AlphaGo、或AlphaGo進階版Master的棋,是一點都沒有違和感的。

文:王銘琬

與AI一樣:由概率出發

趙治勳是日本史上獲得最多頭銜的棋士,二○一六年十一月他以二勝一敗擊敗日本製圍棋AI的DeepZengo後,記者問他:「DeepZengo下得像誰呢?」趙治勳毫不猶豫地說:「像王銘琬!」這並不值得高興,因為DeepZengo是他手下敗將,不過這還是說明,經過緊密的對局過程,可以感覺我的空壓法與AI的下法有相似的地方。

空壓法與AI最基本的相同,在以概率為基礎這一點,AI用強大的計算力算出概率本身,直接選擇勝率較高的著點;空壓法是用概率為基礎做推理與判斷,至今圍棋技術為了獲得確定的知識,在思考時排除概率的想法,雖然有時會用「可能性較高」來解釋棋局,不過是為了完成說明的比喻性字眼,不是根本的思考依據。

空壓法是盡可能排除既有圍棋知識,純粹用著手所得到的概率回報,去思考次一手,這並非異想天開,其實是很自然的事情,AlphaGo的雙劍,「蒙地卡羅方法」與深層學習的單位「人工神經網路」都是以概率處理對象的技術,從AI來看,圍棋可說是概率的大海。

最近的腦科學研究,發現人腦的活動與「貝氏網路(Bayesian network)」很相似,貝氏網路就是將因果關係用概率去記述的模式,用概率去理解圍棋,對人類本來就是很自然的。

圍棋在自己還沒算清楚前,對遊戲人來說,其實都只是概率的對象,本書在於介紹,人可以藉由自己的判斷,以概率為依據,去建構自己的圍棋,在本書上集的〈開天篇〉第四章,對人在棋盤上如何面對概率就有不少敘述。

以我個人的能力,盡可能用概率思考圍棋得到的結論是,圍棋可以用「從寬廣方面壓迫對方」(壓)這個觀點去理解,也是制勝的唯一方法,而要達成這個目的必須「開創比對方大的有利空間」(空),這兩點也是「空」、「壓」法的核心。

圍棋知識至今是由局部的探討開始,像積木般的架構全局,而空壓法是跳開局部,一開始就以全局的命題為首要目標,這也是與AI共通的因素。

用空壓法去觀察AlphaGo、或AlphaGo進階版Master的棋,是一點都沒有違和感的。

開天篇_圖1
Photo Credit: 大塊文化
圖1:Master黑棋,黑1、3是Master愛用的手法,就空壓法觀點,黑棋這樣確保了「比對方大的有利空間」。
開天篇_圖2
Photo Credit: 大塊文化
圖2:這是傳統下法,扣掉貼目,有利空間的優位不明顯。
開天篇_圖3
Photo Credit: 大塊文化
圖3:實戰手順,黑棋「比對方大的有利空間」逼白進入後,黑棋進行「從寬廣方面壓迫對方」的動作,不過黑17的凌厲攻擊,不是我下得出來的。
開天篇_圖4
Photo Credit: 大塊文化
圖4:Master白棋也是一樣,白10、12,下邊14逼後的16、18已無需多作講解,20−28的「壓」之後,白棋30退讓後,還有足夠的有利空間。
開天篇_圖5
Photo Credit: 大塊文化
圖5:白1是傳統下法,與圖4成為不一樣的局面。
開天篇_圖6
Photo Credit: 大塊文化
圖6:黑1後,手拔3、5擴大模樣。
開天篇_圖7
Photo Credit: 大塊文化
圖7:黑9以下,往白棋小目「壓」過去,再黑15跳睥睨全局。

從我來看,因為AI本身實力強大,運用空壓法比我更為靈活。

從空壓法去看圍棋AI的下法,到Master的水平為止,我覺得沒有問題,很多人說AI下的棋看不懂,空壓法或許可以成為我們理解AI圍棋的切入口。

圍棋深奧無比,目前並不能斷定Master的下法優於傳統下法,不過空壓法的觀點,應該能對欣賞AI的棋局有所幫助。

圍棋重要的是怎麼去想,在同樣邏輯下的思考,有時會因人而有不同的答案,可是它們可以說是近親;而在不同思考下,就算結果下同一個地方,其實是偶然撞在一起,毫不相干的路人。

空壓法的起點是認為圍棋的變化是無限的,必須要這樣的前提才可能運用概率純粹思考, 然而若圍棋的變化是無限的,詮釋AI的方法當然不限於空壓法,每一個人可以用自己的觀點去看待AI圍棋,而運用空壓法,也可以用每一個人主觀的推理與判斷,得出不同的次一手。

圍棋書的形式往往非常固定,本書避開大多數棋書的寫法,嘗試介紹圍棋多元的樂趣,而在講解圍棋的部分,盡量不用客觀的圍棋看法,而從對局者本身的主觀去探討圍棋;另一方面,本書的內容均取自我自己的正式比賽,可說是真槍實彈,理應具有一點客觀的技術價值。

每當我迷失下棋方向時,我都會回到一個原點問題——「為什麼要下棋?」我最後得到的答案總是一樣的「因為下棋太快樂了」;除了快樂,下棋本身不會帶給人任何好處,正因為如此,不管AI棋力如何進步,圍棋將永遠為我們的人生平添幾分幸福。

相關書摘 ►本因坊棋王教你用概率下棋——運用「空壓法」,首先要相信自己「一無所知」

書籍介紹

本文摘錄自《新棋紀樂園:開天篇》,大塊文化出版
*透過以上連結購書,《關鍵評論網》由此所得將全數捐贈兒福聯盟

作者:王銘琬

在AI與真人棋士對局屢獲勝績後,趙治勳有感而言,王銘琬的棋術最像AI下法。新版《新棋紀樂園》的開天篇和闢地篇兩本書,王銘琬將為此做了精闢的解說。

新版《新棋紀樂園──開天篇》中,王銘琬以多觀點、對局者的互相趣味對話的方式,將他四十年來棋歷的精華,化為快樂圍棋祕笈——「空壓戰法」。「空」是「空間」,也代表了棋盤上所有棋子的位置關係;「壓」是「壓力」,代表棋盤上棋子的力量關係。「空壓戰法」是就這兩種關係的相關,去推敲下一著最有利的著點。了解了什麼是「空間」、怎麼算出有利空間、如何「壓」、壓的對象與原則之後,就能有守有攻下出一盤好棋。王銘琬認為,「空壓法」與AI同樣都由概率出發。

圍棋要學AI下法,就從《新棋紀樂園》開始。

getImage
Photo Credit: 大塊文化

責任編輯:王國仲
核稿編輯:翁世航


猜你喜歡

Tags: