用概率下棋——運用「空壓法」,首先相信自己「一無所知」

用概率下棋——運用「空壓法」,首先相信自己「一無所知」
Photo Credit: Reuters/達志影像

我們想讓你知道的是

圍棋是藝術還是競賽,是永無答案的大哉問,但也可說答案其實很明瞭,圍棋既是藝術也是競賽。既是A又是B,這不是矛盾嗎?的確如此,人的自我本來就是一個矛盾,人類樂此不疲的圍棋存在矛盾,反而合情合理。

文:王銘琬

相信自己「一無所知」

十年前,圍棋軟體「狂石(CrazyStone)」用蒙地卡羅方法,以勝率為局面的評價函數,讓當時的電腦圍棋界大吃一驚,它的機制是,在所有局面做非常多次「隨機」的模擬到終局,其後選擇其中勝率最高的一手。

當時圍棋被認為是好棋與壞棋很分明的遊戲,教電腦下好棋都來不及了,哪有閒工夫讓電腦玩「隨機」的擲骰子遊戲?蒙地卡羅方法是統計學上很常用的手法,但沒有人覺得跟圍棋有關,將概率這個東西扯上圍棋的,除了十七年前我用空壓法拿到本因坊以外,就是「狂石」作者雷米柯龍。

結果狂石為圍棋軟體帶來重大突破,就算已經明顯超越人類的AlphaGo,它的評價函數一半還是蒙地卡羅法,而另一半的價值網路也是用概率來處理的。

圍棋可以計算著手價值為「×目」,因為有數字指標,至今圍棋評估以「大小是幾目」做基礎,對人來說是最方便的方法。然而如《新棋紀樂園》上集〈開天篇〉所敘述的,大小的比較對我而言非常困難,只好以概率作為自己的起點,「概率」雖然也是數字,但運用起來和確定的數字很不一樣。

把著手定位於「大小」可以說是靜態的思維,空壓法因為起源於人類的計算力不足,而什麼都無法確定,只好由概率出發;這樣圍棋會呈現動態的面向,對局者必須意識的,是自己在什麼樣的姿勢下,採取什麼樣的動作,本書下集〈闢地篇〉提供了兩個運用空壓法的訣竅「中點」與「交點」,我認為在最近的AI對局裡,多少得到驗證。

闢地篇_圖1
Photo Credit: 大塊文化
圖1:黑棋Master下出黑1,令人驚嘆,這個局面黑棋必須花一手把白A吃乾淨,至今的手法是黑B;此後的實戰例,對於黑B白棋還時常千方百計,在右下角黑棋模樣做活,以此而言,人類沒有捨B而改下1的理由;但從空壓法來看,現在局面的「易受影響區域」是下邊C至上邊D跨斷,加上左邊寬廣空間,黑1在確保白A征子的前提下,盡可能靠近易受影響區域的「中點」,是空壓法的標準動作。
闢地篇_圖2
Photo Credit: 大塊文化
圖2:黑1是至今還膾炙人口的阿法肩,對此李世乭長考後2、4應,這樣阿法肩就成為好棋,黑5後棋局一直在AlphaGo的主動下進行。
闢地篇_圖3
Photo Credit: 大塊文化
圖3:白1壓,才能打擊阿法肩損失實利的弱點,但黑2跳,黑棋中央厚實;李世乭對此圖沒有信心,不過我懷疑他是否沒有考慮白3肩,這個局面不只模樣,還有黑AB二子的引出,白3是空壓法不折不扣的「交點」。
闢地篇_圖4
Photo Credit: 大塊文化
圖4:Master白棋對黑1手拔,下白2這也是先鞭「交點」的標準動作,次有白A,而黑若是A應,白棋就得到明顯的「壓」的果實。
闢地篇_圖5
Photo Credit: 大塊文化
圖5:所以我一眼就覺得黑應立刻下1,才是此局面的「交點」,不過經過研究,對黑1白有2的逆襲,黑1不見得能那麼如意,Master讓白A巧妙的派上用場。

AI的概率判斷,是強大機器能力的產物,人類無法模仿;人在日常生活可能不知不覺會用概率的基準去行動,但人運用概率去思考,說不定因為經驗不夠,其實是不擅長的,人在做決定的時候,還是希望這個決定是確實的,而不是基於一個概率數字就拚命,這可說是人的本能。我是人,雖說我認為圍棋的廣大,能讓概率轉換為實際收穫,比起AI,我運用概率其實還是怕三怕四的。

DeepZenGo對趙治勳三番棋的第三局

闢地篇_圖6
Photo Credit: 大塊文化
圖6:DeepZenGo白棋,白1二間高締,手法的大膽超出我的預料。

這個局面,誰都會補強白棋左上角模樣,因為這個模樣很容易成為地,一般都會想補得堅實一點,很多人可能會下A,我充其量也是下B而已,直接下D、C,意圖讓模樣成為確定地也大有人在,然而白1至今是幾乎不被列入選項的。

闢地篇_圖7
Photo Credit: 大塊文化
圖7:黑1是白型的弱點,黑5為止白棋沒有立刻追擊的手段,上邊白地蕩然無存,想到這個結果,我會立刻放棄圖6白1的下法。
闢地篇_圖8
Photo Credit: 大塊文化
圖8:緊接著DeepZenGo白1打入下邊,這個打入與A相關聯,黑棋不好應付,實戰白13為止環顧全局,驚覺白棋形勢大好,從這個局面來看,白B,C,D與黑E,F,G的交換,白棋明顯佔了便宜,達到了「壓」的效果。

圖6白1因為是二間高締,十足用上「空」的壓力才能逼黑棋立刻侵入, DeepZenGo動用包括白A的全局資源,成功啟動「空壓連鎖」,從左上,下邊,左下,做到了一連串的「壓」的動作,可是我為了怕黑棋在上邊生根,一定無法得到這麼好的結果。

本書〈開天篇〉討論過,運用空壓法,首先需要信心——相信概率,而信心的依據,是自己的「一無所知」,在AI的棋力超過人的今天,自己「一無所知」這個理由應該是越來越堅強,而我看AI的對局,最常有的感想是「自己的信心還不夠」,因為人總愛幻想——認為自己得到了某些領悟!

圍棋是藝術還是競賽,是永無答案的大哉問,但也可說答案其實很明瞭,圍棋既是藝術也是競賽。既是A又是B,這不是矛盾嗎?的確如此,人的自我本來就是一個矛盾,人類樂此不疲的圍棋存在矛盾,反而合情合理。

人們忘我下棋,想要比前一刻多理解一點圍棋,但圍棋什麼都懂了就不好玩了,什麼都不懂才最能享受圍棋,這是一個快樂的矛盾,深知自己什麼都不懂,才能深知圍棋的奧妙。

李世乭對AlphaGo三連敗後,第四局終於贏得勝利,記者問他,在連戰連敗窮途末路的時候,為何還有力氣從強大對手扳回一城?

李世乭說:「儘管狀況超壞,我自己提醒自己,對局時不要忘記下棋的樂趣!」

相關書摘 ►AlphaGo下的棋看不懂?「空壓法」或許可以成為我們理解AI圍棋的切入口

書籍介紹

本文摘錄自《新棋紀樂園:闢地篇》,大塊文化出版
*透過以上連結購書,《關鍵評論網》由此所得將全數捐贈兒福聯盟

作者:王銘琬

在AI與真人棋士對局屢獲勝績後,趙治勳有感而言,王銘琬的棋術最像AI下法。新版《新棋紀樂園》的開天篇和闢地篇兩本書,王銘琬將為此做了精闢的解說。

有了「空」與「壓」的概念之後,《新棋紀樂園—闢地篇》中,王銘琬繼續為讀者指出尋找次一手的捷徑——「中點」與「交點」。著眼於「空」的邏輯,就從「中點」著手,下在中點,可讓對方失去選擇寬廣方向的餘地;著眼於「壓」的邏輯,則要找出雙方空間量交會的「交點」,因為該處的影響範圍是盤上最大,因此要從該處的「交點」去尋找次一手。

不過,不管是空壓戰法或是中點、交點,都有無盡的可能,王銘琬透過300盤不同棋局與詰問,講解圍棋的「無限」。圍棋要學AI下法,就從《新棋紀樂園》開始。

getImage_(1)
Photo Credit: 大塊文化

責任編輯:王國仲
核稿編輯:翁世航


猜你喜歡


36歲身價千萬仍然沒有安全感?善用「負債」,縮短與財富自由的距離

36歲身價千萬仍然沒有安全感?善用「負債」,縮短與財富自由的距離
photo credit:VI College價值投資學院

我們想讓你知道的是

本文以VI College價值投資學院的學員案例來分析推導,說明透過系統性的分析、目標設定及投資規劃,財富自由並非遙不可及的夢想,甚至能藉此達成財富自由與志業圓滿的雙重目標。

財富自由是許多人共同夢想,如果可以擁有足夠被動收入讓生活無虞,甚至還能每月度假,相信這是許多人欣羨的生活。然而,財富自由確實是很好的理財目標,卻未必是「快樂」的終點。

36歲的心怡過去時常在各地飛來飛去長達八年,高壓工作、生活作息日夜顛倒,也為自己累積下遠高於同齡人的資產。分析心怡的資產負債現況:現金活存、股票、外幣存款、美股、債券、保險,包含名下一棟房地產,即便房子還有500多萬房貸,但總資產淨值有1300多萬。

她的夢想跟許多人相同,希望能靠著理財就不需要工作,每月有10萬元用來度假、15萬生活開銷資金和給家裡5萬的孝親費,同時維持目前每個月公益捐款的好習慣。現階段生活看似豐盛,但是距離自己設定的3億身家還有相當長一段距離,特別是盤點目前可動用初始資金只有美金3萬元,更讓心怡覺得目標難以達成。而在離開上一份工作後就因為帳面不缺錢而始終待業中,也讓心怡對未來不時感到不安。

擁有千萬身價,想要過上相對充裕、財富自由的生活是否是件難事?或許關鍵就在於資產負債組合當中的「負債」!

六月第二篇_(1)
photo credit:VI College價值投資學院
VI College價值投資學院台灣區總經理黃士豪建議心怡善用負債,打造財富自由並進而追求人生使命感。

給心怡的建議一:財富自由的關鍵在於善用「負債」。

與多數諮詢的學員相比,心怡的投資體質跟觀念都算相當完善,特別是本身資產分配方向十分多元,表現出對於投資她是有長期研究且願意嘗試的。而透過完整檢視「資產負債」「資產損益」及「投資組合」三張表格,我可以在短時間內理解學員本身屬於哪種類型投資者,目前於投資理財方面存在什麼問題通常也能一目了然。

財務問題一定是出在負債嗎?以心怡這個案例來看,反而是卡在分配最多資產於「保險」上,而能讓自己加速達成財富自由的機會,反倒是唯一且最大的負債「房貸」。

心怡的房子目前剩餘房貸已經低於房價50%,我建議她可以尋找銀行重新談30年換貸並加上使用三年房貸寬限期,這樣除了立即將每月10,000多元房貸支出減輕為幾千元,對待業中的心怡來說可減輕相當大支出負擔,還能取得一筆不小的資金將防守型資產轉為進攻型資產。如果又進一步將那些投資報酬率過低的儲蓄險贖回,將資金都投入進攻型投資項目中,能在三年寬限期內靠著投資達成每月10,000多元的被動收入,等同於用手邊資金幫自己繳未來每月房貸。

給心怡的建議二:明確財務目標,距離財富自由其實很近。

但想要財富自由真有那麼困難嗎?或許單靠心怡目前手邊資產能在60歲前達成願望。

如果以心怡目前保障型資產高達518萬、防守型資產1400多萬、進攻型資產僅有250萬,分配比例為24:64:12現況來看,如果維持投資組合現況每年約8%獲利計算,要達到3億身家需要40年9個月。

圖表_1_
photo credit:VI College價值投資學院
資產配置比例分配示意圖

但如果能將保障型資產降低至6%,防守型資產降低為31%,進攻型資產提高到63%,就目前心怡於美股平均獲利為15%,只需要將獲利提高至20%,16年又8個月就能實現3億身家目標。

圖表_2
photo credit:VI College價值投資學院
資產配置比例分配示意圖

但事實上3億真的是必要目標嗎?如果以心怡希望的未來生活來看,即使加上換房、換車及新房裝修等開銷,也只需要1億3千多萬資產,同樣投資組合、同樣獲利只需要13年,心怡於50歲前就能實現財富自由夢想。

給大家的財富建議:比起追求金錢,更該追求使命。

雖然心怡有相當大機會達成財富自由的夢想,但在諮詢過程中我也發現她對未來的不安感,主要原因來自缺乏「使命」。即使可以靠著理財就擁有不錯的生活,但缺乏使命可能會讓人覺得人生沒有重量感。除了追求財富自由,我常常建議學員建議一定要找到「沒有錢也會願意做」的事情,才有辦法創造更多財富,所以建議目前待業中的心怡可以趁著目前還沒有生活壓力,找到「使命」並做為主動收入來源。

我也會透過一連串問題引導學員,從這些問題的答案中找到一個方向後確實執行,無論透過創業、找到相關產業或相關職位,建立屬於自己的中長期志業規劃。在執行跟學習過程當中,也能夠找到更多元的新道路,這是每個成功者在找到財富事業前必經之路,藉由系統性的分析、規劃及目標設定,讓自己找到真正的人生快樂泉源。關鍵在於:你有找到屬於自己的「使命」了嗎?

4_mobile_banner_300x250
photo credit:VI College價值投資學院

本文章內容由「VI College價值投資學院」提供,經關鍵評論網媒體集團廣編企劃編審。


猜你喜歡