用概率下棋——運用「空壓法」,首先相信自己「一無所知」

我們想讓你知道的是
圍棋是藝術還是競賽,是永無答案的大哉問,但也可說答案其實很明瞭,圍棋既是藝術也是競賽。既是A又是B,這不是矛盾嗎?的確如此,人的自我本來就是一個矛盾,人類樂此不疲的圍棋存在矛盾,反而合情合理。
文:王銘琬
相信自己「一無所知」
十年前,圍棋軟體「狂石(CrazyStone)」用蒙地卡羅方法,以勝率為局面的評價函數,讓當時的電腦圍棋界大吃一驚,它的機制是,在所有局面做非常多次「隨機」的模擬到終局,其後選擇其中勝率最高的一手。
當時圍棋被認為是好棋與壞棋很分明的遊戲,教電腦下好棋都來不及了,哪有閒工夫讓電腦玩「隨機」的擲骰子遊戲?蒙地卡羅方法是統計學上很常用的手法,但沒有人覺得跟圍棋有關,將概率這個東西扯上圍棋的,除了十七年前我用空壓法拿到本因坊以外,就是「狂石」作者雷米柯龍。
結果狂石為圍棋軟體帶來重大突破,就算已經明顯超越人類的AlphaGo,它的評價函數一半還是蒙地卡羅法,而另一半的價值網路也是用概率來處理的。
圍棋可以計算著手價值為「×目」,因為有數字指標,至今圍棋評估以「大小是幾目」做基礎,對人來說是最方便的方法。然而如《新棋紀樂園》上集〈開天篇〉所敘述的,大小的比較對我而言非常困難,只好以概率作為自己的起點,「概率」雖然也是數字,但運用起來和確定的數字很不一樣。
把著手定位於「大小」可以說是靜態的思維,空壓法因為起源於人類的計算力不足,而什麼都無法確定,只好由概率出發;這樣圍棋會呈現動態的面向,對局者必須意識的,是自己在什麼樣的姿勢下,採取什麼樣的動作,本書下集〈闢地篇〉提供了兩個運用空壓法的訣竅「中點」與「交點」,我認為在最近的AI對局裡,多少得到驗證。





AI的概率判斷,是強大機器能力的產物,人類無法模仿;人在日常生活可能不知不覺會用概率的基準去行動,但人運用概率去思考,說不定因為經驗不夠,其實是不擅長的,人在做決定的時候,還是希望這個決定是確實的,而不是基於一個概率數字就拚命,這可說是人的本能。我是人,雖說我認為圍棋的廣大,能讓概率轉換為實際收穫,比起AI,我運用概率其實還是怕三怕四的。
DeepZenGo對趙治勳三番棋的第三局

這個局面,誰都會補強白棋左上角模樣,因為這個模樣很容易成為地,一般都會想補得堅實一點,很多人可能會下A,我充其量也是下B而已,直接下D、C,意圖讓模樣成為確定地也大有人在,然而白1至今是幾乎不被列入選項的。


圖6白1因為是二間高締,十足用上「空」的壓力才能逼黑棋立刻侵入, DeepZenGo動用包括白A的全局資源,成功啟動「空壓連鎖」,從左上,下邊,左下,做到了一連串的「壓」的動作,可是我為了怕黑棋在上邊生根,一定無法得到這麼好的結果。
本書〈開天篇〉討論過,運用空壓法,首先需要信心——相信概率,而信心的依據,是自己的「一無所知」,在AI的棋力超過人的今天,自己「一無所知」這個理由應該是越來越堅強,而我看AI的對局,最常有的感想是「自己的信心還不夠」,因為人總愛幻想——認為自己得到了某些領悟!
圍棋是藝術還是競賽,是永無答案的大哉問,但也可說答案其實很明瞭,圍棋既是藝術也是競賽。既是A又是B,這不是矛盾嗎?的確如此,人的自我本來就是一個矛盾,人類樂此不疲的圍棋存在矛盾,反而合情合理。
人們忘我下棋,想要比前一刻多理解一點圍棋,但圍棋什麼都懂了就不好玩了,什麼都不懂才最能享受圍棋,這是一個快樂的矛盾,深知自己什麼都不懂,才能深知圍棋的奧妙。
李世乭對AlphaGo三連敗後,第四局終於贏得勝利,記者問他,在連戰連敗窮途末路的時候,為何還有力氣從強大對手扳回一城?
李世乭說:「儘管狀況超壞,我自己提醒自己,對局時不要忘記下棋的樂趣!」
相關書摘 ►AlphaGo下的棋看不懂?「空壓法」或許可以成為我們理解AI圍棋的切入口
書籍介紹
本文摘錄自《新棋紀樂園:闢地篇》,大塊文化出版
*透過以上連結購書,《關鍵評論網》由此所得將全數捐贈兒福聯盟。
作者:王銘琬
在AI與真人棋士對局屢獲勝績後,趙治勳有感而言,王銘琬的棋術最像AI下法。新版《新棋紀樂園》的開天篇和闢地篇兩本書,王銘琬將為此做了精闢的解說。
有了「空」與「壓」的概念之後,《新棋紀樂園—闢地篇》中,王銘琬繼續為讀者指出尋找次一手的捷徑——「中點」與「交點」。著眼於「空」的邏輯,就從「中點」著手,下在中點,可讓對方失去選擇寬廣方向的餘地;著眼於「壓」的邏輯,則要找出雙方空間量交會的「交點」,因為該處的影響範圍是盤上最大,因此要從該處的「交點」去尋找次一手。
不過,不管是空壓戰法或是中點、交點,都有無盡的可能,王銘琬透過300盤不同棋局與詰問,講解圍棋的「無限」。圍棋要學AI下法,就從《新棋紀樂園》開始。

責任編輯:王國仲
核稿編輯:翁世航