開票日倒數 倒數
0
23
11
50

前往選舉專區

《畢達哥拉斯的思考課》:AlphaGo對弈贏過世界冠軍李世乭的關鍵,正是因為蒙地卡羅搜尋法

《畢達哥拉斯的思考課》:AlphaGo對弈贏過世界冠軍李世乭的關鍵,正是因為蒙地卡羅搜尋法
Photo Credit: Shutterstock / 達志影像

我們想讓你知道的是

AlphaGo在與李世乭對局前,已經從好幾次的虛擬對局中獲取了重要情報。藉由這些資訊,當對方下在特定一點時,便利用機率找出對應該手最佳的一手棋。舉例來說,執白棋的李世乭在深思後選擇下在某一點時,AlphaGo便會搜索至今的資料,並得知下在該點時,白棋的勝率為,也就是說,當下在該點時,他贏了33次中的18次。

文:李光淵(이광연)

人腦輸給AlphaGo的原因­——蒙地卡羅搜尋法

距離現在不過100年前,人們仍自己耕種以備糧食,並在家中自製必要的工具來用。19世紀初,隨著蒸汽機的發明,工廠開始使用機器、大量生產商品。人們的生活方式從農業和手工業,轉變為以使用機器量產必需品的製造業為主的過程,稱為「工業化」或「工業革命」。工業革命一詞最早是由一名法國的學者所創;英國的經濟歷史學家阿諾.湯恩比(Arnold Toynbee)在說明1760-1840年代英國的經濟發展時,將這個詞通俗化。

直至2000年代前半為止,人類經歷了三次工業革命。第一次工業革命發生在1760年到1830年間,並從英國開始,當時英國禁止機器、技術工人和製造技術等外流,但效果並未持續太久。受到英國的影響,以比利時和法國為首的歐洲鄰國也迅速地工業化。

第二次工業革命從19世紀末開始持續到20世紀初,活用了以前沒使用過的石油等天然資源和合成原料。發展了機器、工具和電腦等領域,並因此創建了自動化工廠。然而,以石油等天然資源為原料的工業革命,招致了資源枯竭和環境汙染。

第三次工業革命是在1960年代後,透過網路通訊技術和再生能源的結合而開始,並主要發展於如金融和通訊等服務產業。第四次工業革命則是在2016年1月於瑞士達沃斯舉行的世界經濟論壇上被正式宣告。

現在,我們處於第三次工業革命的尾聲和第四次工業革命中。第四次工業革命一詞最早出現在2010年德國發表的「高科技戰略2020行動計畫」十大計畫之一的「工業4.0」中,以「製造業和電波通訊的融合」之意首次被討論。

第四次工業革命是以第三次工業革命為基礎之數位、生物產業和物理學等各領域的技術融合所帶來的經濟體制和社會構造的急遽變化。第四次工業革命擁有「超連結性」「超智能化」的特徵。人與人、物與物、人與物通過物聯網、雲端等情報通訊技術實現互聯。透過大數據和人工智慧等,促使我們現在所生活的社會有望成為一個更智慧化的社會。

電腦和操作電腦的軟體是引領第四次工業革命時代的核心。對於要在第四次工業革命時代生活下去的我們來說,如何迎接以軟體為中心的各領域的新變化,不只會決定個人,更會決定國家的命運。

尤其,人工智慧建立在數學的基礎上;如字面上的意思,人工智慧是以像人類的智慧一樣能自動學習、思考,並迅速處理指令的軟體為中心的電腦。因此要生活在第四次工業革命時代的我們,必須更加熟悉電腦和軟體才行。

常被活用於人工智慧中的方法是「蒙地卡羅搜尋法」。蒙地卡羅搜尋法是指主要被用在電腦圍棋程式、圖板遊戲、即時電玩、撲克牌等,難以預測對方會如何做下一步行動之類遊戲的方法。簡單來說,蒙地卡羅搜尋法是根據對方的動態,並活用從既往資料得到的機率來決定如何行動的最有利的方法。

在方形的圍棋棋盤上展開的生存競爭遊戲「電腦圍棋」是蒙地卡羅搜尋法的最佳應用。圍棋盤上有直線和橫線各19條,兩者的交點共有361個。分為黑白的兩方,互相輪流在361個點上放下棋子占地並對弈後,依各自所擁有的點(地)的多與少決定勝負。

圍棋的每一手都高深而奧妙,隨著先下在哪一處,會形成完全不同的對弈。並且因為可以下的方式太多,甚至有人說自圍棋發明以來,至今沒有兩局棋是相同的。實際上,下棋時,一開始黑棋可以下在361個點中任意一點,接著白棋可以下在已經擺有黑棋外的360個點中任意一點;如果這麼計算,則圍棋可走的情況數共為361!。要用手來計算361!幾乎不可能,其實際的值大於2.6 x 10845

不過,一般在圍棋中,約只要250個點、150手對局就結束了,因此在平均的情況下,可能的情況數為250150≈10360種。然而,整個宇宙的所有原子個數據稱約為個。因此圍棋的棋局到底有幾種情況……多到令人難以衡量。像這樣,因為圍棋的下法實在太多了,所以使用既有搜尋法的電腦圍棋遊戲實力並不理想。

但是在2016年3月登場的人工智慧「AlphaGo」,卻在共5場的對局中,以4比1的成績贏了世界冠軍的九段棋士李世乭。當時AlphaGo所使用的資料搜尋法正是蒙地卡羅搜尋法。蒙地卡羅搜尋法由選擇、展點、模擬、更新等四步驟構成,在這裡讓我們舉個例子來簡單了解AlphaGo是以什麼方法搜尋並能下出對自己最有利的一手吧。

AlphaGo在與李世乭對局前,已經從好幾次的虛擬對局中獲取了重要情報。藉由這些資訊,當對方下在特定一點時,便利用機率找出對應該手最佳的一手棋。舉例來說,執白棋的李世乭在深思後選擇下在某一點時,AlphaGo便會搜索至今的資料,並得知下在該點時,白棋的勝率為三三分之十八,也就是說,當下在該點時,他贏了33次中的18次。

為了應對李世乭下的這手棋,執黑棋的AlphaGo會搜索可能的下法,找出黑棋的勝率各為十一分之九、十分之四、三分之零的三個點,並選擇下在黑棋的勝率最高的十一分之九的點上。對此,李世乭選擇一點下白棋,而AlphaGo得出當下在該點時白棋的勝率為五分之一。於是AlphaGo再次搜索可能的下法,找出黑棋的勝率各為四分之三和二分之二的兩個點,並選擇將黑棋下在勝率為二分之二的點。接著,李世乭在深思後選擇下在某一點上,最後AlphaGo贏得了圍棋對局。這個過程可以下圖表示;圖中白棋和黑棋內的數字為選擇該點時的勝率。

對局結束後,圍棋棋士們為了了解自己的對弈情況,會進行從第一手開始重新擺放棋子的「覆盤」;AlphaGo為了預備下次對局,會整合這次對局的資料,並將勝率修正如下圖。此時,對局次數和勝利次數會同時遭到修正,下在所選的點時的最終勝率會被更新。

配圖_)_P_258
Photo Credit: 如何出版提供
配圖_)_P_259
Photo Credit: 如何出版提供

上面兩張圖中,雖然一開始白棋所下的點的勝率從三十三分之十八下降為三十四分之十八,但黑棋所下的點的勝率從十一分之九上升至十二分之十,也就是說,白棋一開始選擇的點在目前為止的33局中贏了18次,但因為這場對局輸了,所以被修正為34局中贏了18次。

反面來看,黑棋因為這次對局獲勝,所以在上次為止原本11局中贏了9次的點,被修正為12局中贏10次。另外,雖然白棋第二手下的點的勝率由五分之一下降至六分之一,但黑棋第二手下的點的勝率由二分之二被修正為三分之三。AlphaGo將所下的各點的勝率從最下方往回倒推並一一修正,以為下一場對局做準備。

因此,對人工智慧而言數學不可或缺。將來若想更頻繁接觸和使用人工智慧,就更需要能理解數學,並習得像數學家一樣思考的能力。

書籍介紹

本文摘錄自《畢達哥拉斯的思考課:從通勤到愛情,用數學家的思維解決問題》,如何出版

作者:李光淵(이광연)
譯者:楊嬿霓

  • momo網路書店
  • Readmoo讀墨電子書
  • Pubu電子書城結帳時輸入TNL83,可享全站83折優惠(成人商品、實體商品、限定商品不包含在內,不得與其他優惠併用)
  • 透過以上連結購書,《關鍵評論網》將由此獲得分潤收益。

明快做決策、聰明解決問題、發揮卓越想像力……都少不了數學思考力!
本書集結了各種令你大感意外的數學趣味和故事,
讓你沉浸在解決問題的喜悅之餘,還能獲得全新的領悟!

  • 畢達哥拉斯本身是一名里拉琴高手,也十分重視音樂價值,更是史上第一位將數學語言轉化成音樂的人。
  • 據聞愛因斯坦設計了一個「愛的方程式」,並且解釋說:「不得已離開無法不走的路,而深感遺憾地回首的心!即使是條走不了的路,卻不由自主跟著走的殷切的心!那顆心就是愛。」
  • 俄羅斯的數學家裴瑞爾曼證明了世界七大數學難題之一的「龐加萊猜想」。他對自己達到的成就不求報償,拒絕了100萬美元的獎金,以及大學教授職位和被譽為數學界諾貝爾獎的菲爾茲獎。他說:「我在追尋宇宙的祕密,又怎麼會迷戀100萬美金呢?」
  • 2020年的美國總統大選,拜登透過《動物森友會》在虛擬世界進行競選演說;BTS防彈少年利用線上遊戲《要塞英雄》演唱新歌〈Dynamite〉……
  • 許埈珥23歲才對數學用心,39歲拿菲爾茲獎、解決了11道數學難題,是許多數學家努力一輩子也無法企及的成就。而他的研究將對未來100年間IT和AI領域的發展帶來極大影響。

數學比我們想像中的更貼近生活,
而且,我們也比想像中的更常像數學家一樣思考!

日常生活中會遇到無數的數學問題,買東西、計算遊戲積分、給盆栽澆水、做飯、計算汽車耗油及從家裡到目的地的出發時間……這也是為什麼數學對於我們理解世界、感知情況和做出決定有如此大的影響。你對數學了解得越多,大腦運轉的速度就越快,也能越快地做出決定並清楚自己所做的選擇。而這本書是最好的數學思考練習指南,能幫助我們:發現看不見的事物的能力、分析日常,建立深刻領悟、拓展想像力,精準提問、轉換想法,整合應用!

全書介紹從古代數學家畢達哥拉斯、歐幾里得、費米、高斯,到現代數學家希爾伯特等人不同的33個數學思考。只要想沉浸在思考遊戲的人,誰都可以從中獲得樂趣,並且感受到在其他方面不曾有過的嶄新喜悅。

0010965796-2
Photo Credit: 如何出版

【加入關鍵評論網會員】每天精彩好文直送你的信箱,每週獨享編輯精選、時事精選、藝文週報等特製電子報。還可留言與作者、記者、編輯討論文章內容。立刻點擊免費加入會員!

責任編輯:潘柏翰
核稿編輯:朱家儀