本因坊棋王教你用概率下棋——運用「空壓法」,首先要相信自己「一無所知」

本因坊棋王教你用概率下棋——運用「空壓法」,首先要相信自己「一無所知」
Photo Credit: Reuters/達志影像
我們想讓你知道的是

圍棋是藝術還是競賽,是永無答案的大哉問,但也可說答案其實很明瞭,圍棋既是藝術也是競賽。既是A又是B,這不是矛盾嗎?的確如此,人的自我本來就是一個矛盾,人類樂此不疲的圍棋存在矛盾,反而合情合理。

唸給你聽
powered by Cyberon

文:王銘琬

相信自己「一無所知」

十年前,圍棋軟體「狂石(CrazyStone)」用蒙地卡羅方法,以勝率為局面的評價函數,讓當時的電腦圍棋界大吃一驚,它的機制是,在所有局面做非常多次「隨機」的模擬到終局,其後選擇其中勝率最高的一手。

當時圍棋被認為是好棋與壞棋很分明的遊戲,教電腦下好棋都來不及了,哪有閒工夫讓電腦玩「隨機」的擲骰子遊戲?蒙地卡羅方法是統計學上很常用的手法,但沒有人覺得跟圍棋有關,將概率這個東西扯上圍棋的,除了十七年前我用空壓法拿到本因坊以外,就是「狂石」作者雷米柯龍。

結果狂石為圍棋軟體帶來重大突破,就算已經明顯超越人類的AlphaGo,它的評價函數一半還是蒙地卡羅法,而另一半的價值網路也是用概率來處理的。

圍棋可以計算著手價值為「×目」,因為有數字指標,至今圍棋評估以「大小是幾目」做基礎,對人來說是最方便的方法。然而如《新棋紀樂園》上集〈開天篇〉所敘述的,大小的比較對我而言非常困難,只好以概率作為自己的起點,「概率」雖然也是數字,但運用起來和確定的數字很不一樣。

把著手定位於「大小」可以說是靜態的思維,空壓法因為起源於人類的計算力不足,而什麼都無法確定,只好由概率出發;這樣圍棋會呈現動態的面向,對局者必須意識的,是自己在什麼樣的姿勢下,採取什麼樣的動作,本書下集〈闢地篇〉提供了兩個運用空壓法的訣竅「中點」與「交點」,我認為在最近的AI對局裡,多少得到驗證。

闢地篇_圖1
Photo Credit: 大塊文化
圖1:黑棋Master下出黑1,令人驚嘆,這個局面黑棋必須花一手把白A吃乾淨,至今的手法是黑B;此後的實戰例,對於黑B白棋還時常千方百計,在右下角黑棋模樣做活,以此而言,人類沒有捨B而改下1的理由;但從空壓法來看,現在局面的「易受影響區域」是下邊C至上邊D跨斷,加上左邊寬廣空間,黑1在確保白A征子的前提下,盡可能靠近易受影響區域的「中點」,是空壓法的標準動作。
闢地篇_圖2
Photo Credit: 大塊文化
圖2:黑1是至今還膾炙人口的阿法肩,對此李世乭長考後2、4應,這樣阿法肩就成為好棋,黑5後棋局一直在AlphaGo的主動下進行。
闢地篇_圖3
Photo Credit: 大塊文化
圖3:白1壓,才能打擊阿法肩損失實利的弱點,但黑2跳,黑棋中央厚實;李世乭對此圖沒有信心,不過我懷疑他是否沒有考慮白3肩,這個局面不只模樣,還有黑AB二子的引出,白3是空壓法不折不扣的「交點」。
闢地篇_圖4
Photo Credit: 大塊文化
圖4:Master白棋對黑1手拔,下白2這也是先鞭「交點」的標準動作,次有白A,而黑若是A應,白棋就得到明顯的「壓」的果實。
闢地篇_圖5
Photo Credit: 大塊文化
圖5:所以我一眼就覺得黑應立刻下1,才是此局面的「交點」,不過經過研究,對黑1白有2的逆襲,黑1不見得能那麼如意,Master讓白A巧妙的派上用場。

AI的概率判斷,是強大機器能力的產物,人類無法模仿;人在日常生活可能不知不覺會用概率的基準去行動,但人運用概率去思考,說不定因為經驗不夠,其實是不擅長的,人在做決定的時候,還是希望這個決定是確實的,而不是基於一個概率數字就拚命,這可說是人的本能。我是人,雖說我認為圍棋的廣大,能讓概率轉換為實際收穫,比起AI,我運用概率其實還是怕三怕四的。

DeepZenGo對趙治勳三番棋的第三局
闢地篇_圖6
Photo Credit: 大塊文化
圖6:DeepZenGo白棋,白1二間高締,手法的大膽超出我的預料。

這個局面,誰都會補強白棋左上角模樣,因為這個模樣很容易成為地,一般都會想補得堅實一點,很多人可能會下A,我充其量也是下B而已,直接下D、C,意圖讓模樣成為確定地也大有人在,然而白1至今是幾乎不被列入選項的。

闢地篇_圖7
Photo Credit: 大塊文化
圖7:黑1是白型的弱點,黑5為止白棋沒有立刻追擊的手段,上邊白地蕩然無存,想到這個結果,我會立刻放棄圖6白1的下法。
闢地篇_圖8
Photo Credit: 大塊文化
圖8:緊接著DeepZenGo白1打入下邊,這個打入與A相關聯,黑棋不好應付,實戰白13為止環顧全局,驚覺白棋形勢大好,從這個局面來看,白B,C,D與黑E,F,G的交換,白棋明顯佔了便宜,達到了「壓」的效果。

圖6白1因為是二間高締,十足用上「空」的壓力才能逼黑棋立刻侵入, DeepZenGo動用包括白A的全局資源,成功啟動「空壓連鎖」,從左上,下邊,左下,做到了一連串的「壓」的動作,可是我為了怕黑棋在上邊生根,一定無法得到這麼好的結果。

本書〈開天篇〉討論過,運用空壓法,首先需要信心——相信概率,而信心的依據,是自己的「一無所知」,在AI的棋力超過人的今天,自己「一無所知」這個理由應該是越來越堅強,而我看AI的對局,最常有的感想是「自己的信心還不夠」,因為人總愛幻想——認為自己得到了某些領悟!

圍棋是藝術還是競賽,是永無答案的大哉問,但也可說答案其實很明瞭,圍棋既是藝術也是競賽。既是A又是B,這不是矛盾嗎?的確如此,人的自我本來就是一個矛盾,人類樂此不疲的圍棋存在矛盾,反而合情合理。

人們忘我下棋,想要比前一刻多理解一點圍棋,但圍棋什麼都懂了就不好玩了,什麼都不懂才最能享受圍棋,這是一個快樂的矛盾,深知自己什麼都不懂,才能深知圍棋的奧妙。

李世乭對AlphaGo三連敗後,第四局終於贏得勝利,記者問他,在連戰連敗窮途末路的時候,為何還有力氣從強大對手扳回一城?

李世乭說:「儘管狀況超壞,我自己提醒自己,對局時不要忘記下棋的樂趣!」

相關書摘 ►AlphaGo下的棋看不懂?「空壓法」或許可以成為我們理解AI圍棋的切入口

書籍介紹

本文摘錄自《新棋紀樂園:闢地篇》,大塊文化出版
*透過以上連結購書,《關鍵評論網》由此所得將全數捐贈兒福聯盟

作者:王銘琬

在AI與真人棋士對局屢獲勝績後,趙治勳有感而言,王銘琬的棋術最像AI下法。新版《新棋紀樂園》的開天篇和闢地篇兩本書,王銘琬將為此做了精闢的解說。

有了「空」與「壓」的概念之後,《新棋紀樂園—闢地篇》中,王銘琬繼續為讀者指出尋找次一手的捷徑——「中點」與「交點」。著眼於「空」的邏輯,就從「中點」著手,下在中點,可讓對方失去選擇寬廣方向的餘地;著眼於「壓」的邏輯,則要找出雙方空間量交會的「交點」,因為該處的影響範圍是盤上最大,因此要從該處的「交點」去尋找次一手。

不過,不管是空壓戰法或是中點、交點,都有無盡的可能,王銘琬透過300盤不同棋局與詰問,講解圍棋的「無限」。圍棋要學AI下法,就從《新棋紀樂園》開始。

getImage_(1)
Photo Credit: 大塊文化

責任編輯:王國仲
核稿編輯:翁世航