AI的崛起,讓我們不再毫無頭緒地在數不盡的星系中尋找地外生命

AI的崛起,讓我們不再毫無頭緒地在數不盡的星系中尋找地外生命
Photo Credit: Harp et al., 2016.

我們想讓你知道的是

因為一些物理機制,宇宙中許多天體會「自然地」產生無線電波,只要我們「過濾」掉這些有著「自然起源」的無線電波訊號,剩下的便不排除可能來自於某種地外生物或文明。不過,這可不是件容易的任務。

文:Balboa Crenshaw(現職為數據科學家)

AI的崛起,讓我們能更有效率地分析大量天文觀測資料,不再只是毫無頭緒地在數不盡的星系、恆星與行星中尋找地外生命。

大數據尋找地外生命

目前所有位於太空中的太空望遠鏡,每15秒可以產出2GB的數據,這還不包含位於地表的望遠鏡所蒐集到的觀測資料。很明顯的,如果外星人真的存在而我們至今還沒找到外星人與我們溝通的證據,很大一部分是因為我們處理大數據的效率實在太差。

如此龐大的資料量,傳統的人工分析勢必無法負荷。借助深度學習網路能夠「即時」分析「大量」數據的優勢,本文將介紹兩種在天文界逐漸開始普及的方法:一是分析太陽系外行星(Exoplanets),找出其中的類地行星;另一種則是尋找太空中非自然的無線電波訊號源,也許就有機會「接收到」我們先前都錯過的外星訊息。

尋找系外類地行星

「系外行星系統」,你可以理解為遠方的「太陽系」。科學家找到系外行星系統之後,再從中篩選出類似地球的行星,並進一步觀察、分析。這種方式最大的優勢在於,經過多次「篩選」,資源可以更精確地放在數量相對較少的目標行星上。而所謂的「篩選」,其實就是機器學習常見的「分類」(Classification)。

因為行星本身不發光,當我們觀測到一顆恆星,想要知道是否是一個行星系統時,只能從恆星的亮度變化旁敲側擊:當行星公轉繞行到恆星前方(靠近地球一側)時,該恆星的亮度會稍稍降低。也就是說,如果我們根據恆星在各個時間點的亮度作圖,便能發現所畫出的變化曲線會規律地出現「凹口」。這些「凹口」,正是機器學習模型可以用來當作特徵(feature)的分類依據。

天文學家將觀測到許許多多恆星的亮度曲線,配合已知的系外行星系統作為訓練集,放入一個卷積神經網路(Convolutional Neural Network,CNN)模型,便可以得到「推測」含有系外行星的「目標恆星」(如下圖)。CNN是深度學習網路的一種,常用於電腦視覺(Computer vision),藉由圖樣獨有的特徵為圖像分類。恆星的亮度曲線,在此便可以視為一種單維度的「圖樣」。

ai-alien-01
Photo Credit: Shallue et al., 2018
經分類過後的恆星亮度曲線。「含有行星系統」的恆星亮度曲線(標示為藍色)在平面上的位置相近,形成一個聚落,科學家可以藉此確認所使用的機器學習模型是可靠的

確定哪些恆星有行星系統之後,下一步就是要找出哪幾顆行星比較「像」地球了。光靠恆星的亮度曲線無法得知這一點,科學家得靠著系外行星系統的「光譜」來斷定:如果系外行星的表面有大氣(例如地球的大氣有氮氣、氧氣與水汽),這些大氣分子會吸收或放出特定波長的光,於是我們透過系外行星的「光譜」推測它們的大氣組成,以及是否與地球雷同。而光譜在本質上與上面提到的「恆星亮度曲線」類似,都可以當作單維度的圖像,以人工神經網路進行分類。

不同的是,這裡天文學家運用的是「貝式神經網路」(Bayesian Neural Networks, BNN)。這種神經網路運用了統計學裡面的「貝氏定理」(Bayes’ Theorem),輸出除了系外行星光譜的分類(大氣組成)之外,還另外包含了「機率」(Probability)與「不準度」(Uncertainty)等資訊(如下圖)。科學家可以利用這些資訊得知輸入的光譜是否含有太多雜訊,以及所得到的大氣組成有多「靠譜」。

ai-alien-03
Photo Credit: Waldmann, 2016.
左側為四個放入貝氏神經網路的系外行星光譜,右側則是經神經網路分析後所得出各種組成分子存在的機率。可以看見第一顆(第一列)系外行星的大氣中也許含有水(H2O),第二顆也許含有甲烷(CH4)。

畢竟這些系外行星都距離地球相當遙遠,科學家只能「間接」透過光譜推測各行星的大氣組成,從而選出適合生命生存,或有生命存在跡象的星球進一步觀測。

非自然的無線電波源

另一種方法可就相當有野心了。因為一些物理機制,宇宙中許多天體會「自然地」產生無線電波,只要我們「過濾」掉這些有著「自然起源」的無線電波訊號,剩下的便不排除可能來自於某種地外生物或文明。不過,這可不是件容易的任務。

首先,天文學家必須善用有限的時間與資源,準確地對著天空特定方向觀測,並確保有能力處理所接收到的大量無線電波數據。此外,在地表所接收到的無線電波訊號,勢必受到人類文明的干擾。如何排除這些雜訊,也是另一個必須要面對的問題。

著名的「搜尋地外文明計劃」(Search for ExtraTerrestrial Intelligence,SETI)解決了前者硬體上的困難。這個計畫運用了許多著名的地表望遠鏡來蒐集各方無線電波數據,包含不久前剛損毀的阿雷西波電波望遠鏡(Arecibo Observatory),與專為SETI計畫而設的艾倫望遠鏡陣列(Allen Telescope Array,ATA)。

在後者的問題上,人工神經網路倒可以助天文學家一臂之力,例如將下圖中稱為「瀑布圖」(Waterfall plot)的無線電波觀測數據分類:A只是單純的雜訊;C、D為「射頻干擾」(Radio frequency interference,RFI)圖樣,是來自地球人類文明的干擾;B則是一種連續發射的無線電波圖樣,較有可能來自地外文明,值得更深入的研究。即使後續的研究最終否定了B來自地外文明的可能,但也讓天文學家得以善用有限的資源與時間,「更聰明地」尋找外星人。

ai-alien-05
Photo Credit: Harp et al., 2016.
艾倫望遠鏡陣列所觀測到的「瀑布圖」,橫軸為無線電波的頻率,縱軸則為觀測的時間

參考資料

  1. C. Shallue and A. Vanderburg, “Identifying Exoplanets with Deep Learning: A Five-planet Resonant Chain around Kepler-80 and an Eighth Planet around Kepler-90“, The Astronomical Journal, vol. 155, no. 2, p. 94, 2018.
  2. G. Harp et al., “SETI Observations of Exoplanets with the Allen Telescope Array“, The Astronomical Journal, vol. 152, no. 6, p. 181, 2016.
  3. I. Waldmann, “Dreaming of Atmospheres“, The Astrophysical Journal, vol. 820, no. 2, p. 107, 2016.
  4. SETI Institute.

延伸閱讀

本文由臺大科學教育發展中心授權刊登,原文發表於此

責任編輯:丁肇九
核稿編輯:翁世航


Tags: