本因坊棋王教你用概率下棋——運用「空壓法」,首先要相信自己「一無所知」

本因坊棋王教你用概率下棋——運用「空壓法」,首先要相信自己「一無所知」
Photo Credit: Reuters/達志影像

我們想讓你知道的是

圍棋是藝術還是競賽,是永無答案的大哉問,但也可說答案其實很明瞭,圍棋既是藝術也是競賽。既是A又是B,這不是矛盾嗎?的確如此,人的自我本來就是一個矛盾,人類樂此不疲的圍棋存在矛盾,反而合情合理。

文:王銘琬

相信自己「一無所知」

十年前,圍棋軟體「狂石(CrazyStone)」用蒙地卡羅方法,以勝率為局面的評價函數,讓當時的電腦圍棋界大吃一驚,它的機制是,在所有局面做非常多次「隨機」的模擬到終局,其後選擇其中勝率最高的一手。

當時圍棋被認為是好棋與壞棋很分明的遊戲,教電腦下好棋都來不及了,哪有閒工夫讓電腦玩「隨機」的擲骰子遊戲?蒙地卡羅方法是統計學上很常用的手法,但沒有人覺得跟圍棋有關,將概率這個東西扯上圍棋的,除了十七年前我用空壓法拿到本因坊以外,就是「狂石」作者雷米柯龍。

結果狂石為圍棋軟體帶來重大突破,就算已經明顯超越人類的AlphaGo,它的評價函數一半還是蒙地卡羅法,而另一半的價值網路也是用概率來處理的。

圍棋可以計算著手價值為「×目」,因為有數字指標,至今圍棋評估以「大小是幾目」做基礎,對人來說是最方便的方法。然而如《新棋紀樂園》上集〈開天篇〉所敘述的,大小的比較對我而言非常困難,只好以概率作為自己的起點,「概率」雖然也是數字,但運用起來和確定的數字很不一樣。

把著手定位於「大小」可以說是靜態的思維,空壓法因為起源於人類的計算力不足,而什麼都無法確定,只好由概率出發;這樣圍棋會呈現動態的面向,對局者必須意識的,是自己在什麼樣的姿勢下,採取什麼樣的動作,本書下集〈闢地篇〉提供了兩個運用空壓法的訣竅「中點」與「交點」,我認為在最近的AI對局裡,多少得到驗證。

闢地篇_圖1
Photo Credit: 大塊文化
圖1:黑棋Master下出黑1,令人驚嘆,這個局面黑棋必須花一手把白A吃乾淨,至今的手法是黑B;此後的實戰例,對於黑B白棋還時常千方百計,在右下角黑棋模樣做活,以此而言,人類沒有捨B而改下1的理由;但從空壓法來看,現在局面的「易受影響區域」是下邊C至上邊D跨斷,加上左邊寬廣空間,黑1在確保白A征子的前提下,盡可能靠近易受影響區域的「中點」,是空壓法的標準動作。
闢地篇_圖2
Photo Credit: 大塊文化
圖2:黑1是至今還膾炙人口的阿法肩,對此李世乭長考後2、4應,這樣阿法肩就成為好棋,黑5後棋局一直在AlphaGo的主動下進行。
闢地篇_圖3
Photo Credit: 大塊文化
圖3:白1壓,才能打擊阿法肩損失實利的弱點,但黑2跳,黑棋中央厚實;李世乭對此圖沒有信心,不過我懷疑他是否沒有考慮白3肩,這個局面不只模樣,還有黑AB二子的引出,白3是空壓法不折不扣的「交點」。
闢地篇_圖4
Photo Credit: 大塊文化
圖4:Master白棋對黑1手拔,下白2這也是先鞭「交點」的標準動作,次有白A,而黑若是A應,白棋就得到明顯的「壓」的果實。
闢地篇_圖5
Photo Credit: 大塊文化
圖5:所以我一眼就覺得黑應立刻下1,才是此局面的「交點」,不過經過研究,對黑1白有2的逆襲,黑1不見得能那麼如意,Master讓白A巧妙的派上用場。

AI的概率判斷,是強大機器能力的產物,人類無法模仿;人在日常生活可能不知不覺會用概率的基準去行動,但人運用概率去思考,說不定因為經驗不夠,其實是不擅長的,人在做決定的時候,還是希望這個決定是確實的,而不是基於一個概率數字就拚命,這可說是人的本能。我是人,雖說我認為圍棋的廣大,能讓概率轉換為實際收穫,比起AI,我運用概率其實還是怕三怕四的。

DeepZenGo對趙治勳三番棋的第三局

闢地篇_圖6
Photo Credit: 大塊文化
圖6:DeepZenGo白棋,白1二間高締,手法的大膽超出我的預料。

這個局面,誰都會補強白棋左上角模樣,因為這個模樣很容易成為地,一般都會想補得堅實一點,很多人可能會下A,我充其量也是下B而已,直接下D、C,意圖讓模樣成為確定地也大有人在,然而白1至今是幾乎不被列入選項的。

闢地篇_圖7
Photo Credit: 大塊文化
圖7:黑1是白型的弱點,黑5為止白棋沒有立刻追擊的手段,上邊白地蕩然無存,想到這個結果,我會立刻放棄圖6白1的下法。
闢地篇_圖8
Photo Credit: 大塊文化
圖8:緊接著DeepZenGo白1打入下邊,這個打入與A相關聯,黑棋不好應付,實戰白13為止環顧全局,驚覺白棋形勢大好,從這個局面來看,白B,C,D與黑E,F,G的交換,白棋明顯佔了便宜,達到了「壓」的效果。

圖6白1因為是二間高締,十足用上「空」的壓力才能逼黑棋立刻侵入, DeepZenGo動用包括白A的全局資源,成功啟動「空壓連鎖」,從左上,下邊,左下,做到了一連串的「壓」的動作,可是我為了怕黑棋在上邊生根,一定無法得到這麼好的結果。

本書〈開天篇〉討論過,運用空壓法,首先需要信心——相信概率,而信心的依據,是自己的「一無所知」,在AI的棋力超過人的今天,自己「一無所知」這個理由應該是越來越堅強,而我看AI的對局,最常有的感想是「自己的信心還不夠」,因為人總愛幻想——認為自己得到了某些領悟!

圍棋是藝術還是競賽,是永無答案的大哉問,但也可說答案其實很明瞭,圍棋既是藝術也是競賽。既是A又是B,這不是矛盾嗎?的確如此,人的自我本來就是一個矛盾,人類樂此不疲的圍棋存在矛盾,反而合情合理。

人們忘我下棋,想要比前一刻多理解一點圍棋,但圍棋什麼都懂了就不好玩了,什麼都不懂才最能享受圍棋,這是一個快樂的矛盾,深知自己什麼都不懂,才能深知圍棋的奧妙。

李世乭對AlphaGo三連敗後,第四局終於贏得勝利,記者問他,在連戰連敗窮途末路的時候,為何還有力氣從強大對手扳回一城?

李世乭說:「儘管狀況超壞,我自己提醒自己,對局時不要忘記下棋的樂趣!」

相關書摘 ►AlphaGo下的棋看不懂?「空壓法」或許可以成為我們理解AI圍棋的切入口

書籍介紹

本文摘錄自《新棋紀樂園:闢地篇》,大塊文化出版
*透過以上連結購書,《關鍵評論網》由此所得將全數捐贈兒福聯盟

作者:王銘琬

在AI與真人棋士對局屢獲勝績後,趙治勳有感而言,王銘琬的棋術最像AI下法。新版《新棋紀樂園》的開天篇和闢地篇兩本書,王銘琬將為此做了精闢的解說。

有了「空」與「壓」的概念之後,《新棋紀樂園—闢地篇》中,王銘琬繼續為讀者指出尋找次一手的捷徑——「中點」與「交點」。著眼於「空」的邏輯,就從「中點」著手,下在中點,可讓對方失去選擇寬廣方向的餘地;著眼於「壓」的邏輯,則要找出雙方空間量交會的「交點」,因為該處的影響範圍是盤上最大,因此要從該處的「交點」去尋找次一手。

不過,不管是空壓戰法或是中點、交點,都有無盡的可能,王銘琬透過300盤不同棋局與詰問,講解圍棋的「無限」。圍棋要學AI下法,就從《新棋紀樂園》開始。

getImage_(1)
Photo Credit: 大塊文化

責任編輯:王國仲
核稿編輯:翁世航


猜你喜歡


年薪破百萬在台北買不起房?調整資產配置,買房不難!

年薪破百萬在台北買不起房?調整資產配置,買房不難!
Photo Credit: VI College價值投資學院

我們想讓你知道的是

想在買房時擁有好的貸款條件,一定要趁有穩定好工作的時候申貸較佳。面對通膨升息時代的來臨,大家務必聰明善用資產配置成為人生最佳助力,而不是讓買房成為拖垮自己財務的稻草。

本文作者:VI College價值投資學院 台灣區總經理 黃士豪

買房是很多人畢生夢想,許多上班族開始投資的動機,也是希望透過能扣除每月支出後、盡可能放大剩餘的存款,更快買到人生第一間房。但是看著房價不斷飛漲,媒體不斷報導百萬年薪工程師、醫師都無法在台北置產,讓很多人感到恐慌、甚至放棄買房念頭。

32歲的飛輪教練阿謙很努力賺錢,汲汲營營忙於工作,希望能買一兩千萬的房子,好安身立命。為了達成目標他相當努力培養技能,除了具有飛輪跟肌力教練資格外,平時也提供學員筋膜按摩服務。

因為服務口碑很好,目前團體加個人每月穩定都有100小時課程,即使前段時間疫情不穩定也只有少掉一成教練收入,月收入約為6至10萬。

對於未來目標,阿謙除了希望可以透過被動收入增加、改變目前靠時間及體力換取金錢的現況,也希望能夠買入兩間2000萬的房子,一間自住、一間出租賺取被動收入。

既有資產配置上,由於懷抱著買房夢,因此阿謙保留110萬活存現金,另外有一張台幣56萬的美元保單,投入美股58萬有不錯獲利。

買房對平均月收入8萬的阿謙來說是否為不可能任務?我認為,阿謙應該先拋掉想法便是:別為了賺頭期款而投資。

五月第一篇
photo credit:VI College價值投資學院
VI College價值投資學院 台灣區總經理 黃士豪建議阿謙讓投資為自己置產。

給阿謙的投資建議一:別為買房投資,要讓投資為你置產。

遇到像阿謙這樣懷抱著買房夢的學員,我都會先要他們反覆問自己:為什麼要買房?

如果從資產及投資角度來看,房子算是防守型資產,如果將房屋價值放進整個資產配置後,花在買房的錢就不能超過總資產50%,否則就會讓自己變成房奴,更會因為多數資產都卡在房子,而因為房價變化影響心態。

假設買房能為自己帶來安全感,那這想法相當好、也值得去達成這個人生目標,這時就可以思考如何利用投資來幫自己買房。

以阿謙希望買到2000萬的房這個目標來看,房價2000萬首購需支出頭期款為400萬,這時除了要因為固定支出增加房貸這一項,因此要提高保障型資產外,也要確保進攻型投資組合有400萬,並透過選擇權等投資方式妥善配置讓自己能利用每年10-20%投資報酬來支付房貸本金及利息。

給阿謙的投資建議二:想買房保障人生,別抱持保障心態投資

在與阿謙諮詢對談過程中,我也看到許多保守型投資人最容易落入的「陷阱」:認為是保障,其實處於風險中。

將錢投入投資市場,因為跌價造成損失,這是一種可視但未知的風險。但是如果將錢都投入到定存、活存現金中,每年因為通貨膨脹造成損失,加上失去將錢轉進保守型甚至進攻型投資組合中能產生的獲利,這是屬於容易忽略但已知的風險。

保障型資產是為了當有突發風險產生時,讓我們不用擔心生計並可渡過半年時間進行避險。就阿謙每月支出約5萬來說,保留30萬是足夠的。特別是在進攻型投資組合都握有許多高價值公司並有不錯獲利時,應該將額外80萬緊急帳戶資金及活存轉進進攻型投資組合,才能更快達成買房目標。

而究竟是否該買第二間房出租賺取被動收入,我也請阿謙好好想想:買第二間房的目的是什麼?

如果買房是為了投資,那麼比起將一大筆錢投入保守型資產,以阿謙還年輕並且收入相對穩定情況下,該如何積極進攻讓自己退休時可以擁有千萬甚至億萬資產,才是最適當思考方式。

這些建議也適合你:購買投資型保單前先停看聽

在阿謙現有投資組合當中,我也看到在許多學員資產配置中都會出現的「投資型保單」。這類同時具備投資及保險功能的保單屬於保守型資產,因此建議在購買時要注意投入金額加上其他保守型投資不要超過總資產20%外,更要先釐清以下關鍵。

首先便是保單報酬形式為何?是在一定年限後固定會發放股息給保戶,還是保險公司會每年將這些錢投入特定投資標的做為報酬?這些資產增長能否看得見,甚至是否穩定,必須先了解。

其次則是這些保單綁約年限,這會影響可動用資金及運用彈性。當然,既然是保險更要確認又是綁定哪方面保險,在自己真正需要時是否能夠降低醫療或意外造成風險。懂得從資產角度思考保單,可以讓你在投資道路上少走相當多冤枉路。

附帶一提,想在買房時擁有好的貸款條件,一定要趁有穩定好工作的時候申貸較佳。面對通膨升息時代的來臨,大家務必聰明善用資產配置成為人生最佳助力,而不是讓買房成為拖垮自己財務的稻草。

image

本文章內容由「VI College價值投資學院」提供,經關鍵評論網媒體集團廣編企劃編審。


猜你喜歡