《AIQ》:貝氏定理再次流行,在幕後控制著每輛自駕車的方向盤

《AIQ》:貝氏定理再次流行,在幕後控制著每輛自駕車的方向盤
Photo Credit: Depositphotos

我們想讓你知道的是

你這輩子可能永遠沒有機會坐下來、拿著紙筆仔細研究貝氏定理的數學公式,即使如此也無妨,但你至少要學會運用貝氏定理自駕車的方式,來思考這個世界。學習利用先驗機率與數據,知道如何結合兩者,可以幫助你成為更聰明的人。

文:尼克・波爾森(Nick Polson)、詹姆士・史考特(James Scott)

貝氏推論和自駕車

時至今日,貝氏定理再次流行,發展得比過去更好,居於幕後控制著每輛自駕車的方向盤。

貝氏定理是一個方程式,告訴我們如何根據新的訊息更新我們的信念,將先驗機率轉化為後驗機率。為先前討論的機器人問題,亦即SLAM同步定位與地圖建置的問題,提供了完美的解決方案。SLAM本質上就是貝氏定理的問題。隨著傳感器接收新數據,自駕車必須更新周圍環境的「心理地圖」,如車道標誌、交叉路口、交通信號燈、停車標誌以及路上所有行駛的車輛,同時推斷自身在該環境中的不確定位置。本質上,自駕車「認為」自己本身就是一個機率點,沿著貝葉斯的道路行駛。

解釋自駕車的運作方法之前,先解決一個顯而易見的問題:為何不用GPS全球定位技術導航就好,就像我們在智慧型手機上使用的裝置一樣?因為即使在理想條件下,一般人用的GPS系統準確度也只有5公尺左右,在隧道或高樓大廈附近更糟,誤差範圍達30∼40公尺。只用GPS導航城市交通,就像強迫醫生戴著烤箱手套和眼罩開血管外科手術一樣荒謬。

因此,為了補強從GPS接收器獲得的訊息,自駕車必須藉助其他傳感器,有些是普通的老式攝影機,有些則像現在大多數新車都具備的安全功能,像是安裝在保險槓上的雷達,在駕駛人倒車時快撞上某物時會發出嗶聲警告。

自駕車最酷炫實用的傳感器叫做光學雷達(LIDAR),顧名思義,這種設備結合了「光」和「雷達」,代表「光檢測和測距」(light detection andranging)。想像一下自己戴著眼罩,只能拄著拐杖摸索走出陌生的房間。這時,可以透過觸摸,也就是用拐杖戳點周邊路徑,大概估量自己與周遭物品的距離。如果你在不同方向,重覆摸索多次後,就能替周圍環境建立清楚的心理地圖。

LIDAR陣列的運作原理相同,它發出一道雷射光束,透過計算光線反彈所需的時間來測量距離。典型的LIDAR陣列可能有64個單獨的雷射器,每個雷射器每秒發出數十萬個脈衝。每一道雷射光束針對特定方向提供非常詳盡的資訊。為了讓自駕車擁有全方位的視角,會將光學雷達安裝在車頂上的旋轉組件;組件每分鐘旋轉約三百次,就像《捍衛戰士》(Top Gun)雷達螢幕上的旋轉光束一樣,只不過速度更快。因此,大約每秒五次,雷射器會指向任何一個方向,從而提供汽車離散、非連續的位置更新。換句話說,自駕車所看到的世界不是透過穩定的陽光照射,而是透過閃光燈——來自光學雷達和其他傳感器數據傳輸的短暫閃光,每次閃光都提供一個新的環境視圖,如【圖 3.4】所示:

AIQ-圖3_4
Photo Credit: 商業周刊提供

每當自駕車接收到新的連續突發資料(data burst)時,就會運用貝氏定理,更新對自身所在位置的「認知」。我們可以透過地圖視覺,呈現貝氏推論更新的過程。在地圖中,道路被分解成小單元網格,每個網格都有自己的機率。假設你乘著自駕車開出車道,上路僅60秒,以時速30英里行駛。根據截至目前為止的數據,車子對於自身所在位置會有一套認知,也就是【圖3.5】左上的機率圖。現在讓我們在0.2秒之後,也就是上路60.2秒時檢查汽車,經過LIDAR陣列掃描一輪之後,這些認知會有什麼變化?

AIQ-圖3_5
Photo Credit: 商業周刊提供

自駕車的推理有三個步驟。步驟一是導航專家所謂的「航位推測法」(dead reckoning),我們常稱之為「內省和外推」(introspection andextrapolation)。「內省」代表蒐集汽車「內部狀態」的資訊,如車速、車輪角度和加速度;「外推」則代表利用這些資訊及物理定律,預測汽車在下一秒瞬間可能的移動;結果就會產生汽車上路60.2秒時所在位置的先驗機率圖,如【圖 3.5】右上所示。這些機率是「先驗」的,因為尚未被納入更新的傳感器數據,我們正處於閃光燈下一次閃光之前的瞬間。

在此請注意兩點:機率的分析區塊在道路上下移了一點,並被「擴散」到更大的區域,這種擴散表示「外推」增添了不確定性。假設車子以時速30英里行駛,那麼在0.2秒時的行車範圍大約是9英尺。但是,由於意外轉向、剎車或加速的結果,實際的行車範圍可能有所增減。

自駕車的第二步是收集外部傳感器的數據,如照相機和光學雷達。這些數據提供對汽車位置的現實查核,有助於糾正因外推而起的錯誤。這部分請參見【圖 3.5】左下,請將該圖看成一組「純傳感器」的機率,也就是說,在沒有任何先驗訊息的情況下,僅憑外部傳感器,汽車對自身所在位置的認知。

然而,汽車確實有先驗訊息,因此第三步、也就是最後一步便是「整合」。運用貝氏定理,將外推的先驗機率(來自步驟一)與傳感器數據(來自步驟二)兩者相結合;在【圖 3.5】右下,你可以看到更新的後驗機率圖,針對「我在哪裡?」的基本問題,提供了修正的答案。最重要的是,比起單獨存在的先驗機率或傳感器數據機率,後驗機率的區塊沒有那麼擴散模糊。和任何單一訊息來源相比之下,兩種訊息結合通常代表不確定性較小。

我們省略了許多細節,但保留了最重要的一點:在上述例子中,我們假裝道路是固定的坐標空間,唯一未知的變數是汽車在該空間內的位置,這是SLAM中L代表的「定位」(Localization)。但不要忘記還有M所代表的「地圖建置」(Mapping)。事實上,道路本身是未知的,所有特徵都同樣在貝氏原理之下運作,道路邊界、車道線、行人、其他車輛甚至是袋鼠,全部都代表機率的分析區塊,根據傳感器所發送的每一次數據傳輸,不斷更新位置。