開票日倒數 倒數
0
23
11
50

前往選舉專區

《自然》期刊公布東亞科學明星:來自台灣的空汙專家、中文版「Siri」推手入榜

《自然》期刊公布東亞科學明星:來自台灣的空汙專家、中文版「Siri」推手入榜
Photo Credit: 成功大學網站

我們想讓你知道的是

6月27日出刊的《自然》,列舉了10位來自香港、馬來西亞、新加坡、韓國和台灣的10位東亞科學新星,其中有2位就來自台灣。

國際科學權威期刊《自然》(Nature)在最新一期的專欄文章中,列舉10名東亞科學明星,其中有兩位來自台灣,分別是被譽為「空氣把關者」的成大校長蘇慧貞,與被稱為「程式編碼先鋒」的台大電機系教授李琳山。

6月27日出刊的《自然》,列舉了10位來自香港、馬來西亞、新加坡、韓國和台灣的頂尖研究人員,從癌症治療、生物燃料、基因研究到傳染病等領域,表示這些來自東亞區域的科學家,正在對全球產生重大影響力。專欄中點名的10位東亞科學新星,其中有2位就來自台灣。

她是「空氣把關者」,也是成大第一位女校長

蘇慧貞是美國哈佛大學環境衛生科學博士,她一直對污染如何影響人類感興趣,完成博士學位後,她花了一年的時間研究美國政府的一項重大研究項目,親眼目睹了許多家庭惡劣的生活條件,影響她對科學研究如何能幫政府訂定政策,保護民眾健康。

回到台灣後,蘇慧貞與她的團隊花費10多年的時間,研究室內空氣污染對健康的威脅,特別是南部許多房屋中,因為炎熱潮濕而有高濃度的過敏原(如塵蟎和真菌),誘發呼吸系統的問題。

蘇慧貞等人在1999年提出研究數據,要求政府考慮制定室內環境的空氣污染品質標準,使台灣成為繼南韓之後,全世界第二個立法管制室內空氣品質的國家。

2005年,台灣開始針對室內空氣污染品質制定標準,並在2011年經立法院三讀通過《室內空氣品質管理法》,以法治力量規範室內空氣品質。

接受採訪時,蘇慧貞表示,對於自己的研究能夠幫助政府訂定標準,保護民眾健康,她感到相當自豪,「當訂定室內空氣品質污染標準成為議題時,我們已經掌握大量不容置疑的研究數據,因此能順利推動促成公部門設置管制空氣品質法案。」

而蘇慧貞攻讀哈佛大學公衛學院環境衛生科學博士的指導教授史賓格勒(John Spengler)談及自己的指導學生時則表示,「蘇慧貞就是有種能讓人們停止比手劃腳,專注於眼前事務的能力,也因此能夠這麼有效率地產生影響力。」

自從擔任大學校長以來,蘇慧貞將重點放在研究空氣污染及其健康影響的數據如何幫助努力提高社會對全球變暖的適應能力。她說:「我們有什麼選擇來幫助人們和我們的建築環境,更適應不斷變化的氣候?」

成大也在本月15日和日本東京電力電網集團(TEPCO PG)簽署「跨國產學研發合作備忘錄」,雙方將以台南沙崙「綠能科學城」為研發中心,共同探討減少電力浪費的商業模式,包括了能源政策設計、數據管理、宅內物聯網服務等議題。

一個致力於公共健康的人應該永遠記得那些處於不利地位的人。」蘇慧貞告訴《科學》,「這是這些年來我的核心價值觀和原則」。

比「Siri」早了16年,中文語音辨識的先驅其實來自台灣

另一位入選的台灣科學新星,則是專門鑽研中文語音辨識(speech recognition)技術的台大電機系教授李琳山。

李琳山於1977年於美國史丹佛(Stanford)大學拿到電機博士,原本在美國從事與衛星技術相關的工作,不過之後卻回到台灣,投入之前完全不熟悉的領域──語音辨識,也就是現在人們熟悉的「語音輸入」服務。

李琳山表示,「當我決定回家時,所有的朋友都說『你太愚蠢了,臺灣根本沒有衛星領域的工作』。」

不過回到家鄉後,李琳山開始研究起語音辨識技術,超過10年的時間,李琳山的團隊打造了一個原始又緩慢的裝置,需花費5~6秒才能識別一個音節。然而,這個發明卻是一個巨大的成就,因為這是第一個專門為中文打造的語音辨識裝置。到了1995年,李琳山的機器已經有能力將連續的中文音檔轉換成一系列單字,比Siri(2011年)早了整整16年。

「語音識別是一項非常困難的挑戰」美國麻省理工學院研究員葛萊斯(Jim Glass)表示,因為每個人的說話的方式法都略有不同,且往往是在連續不斷又有些吵雜的環境下說話,而「李琳山是中文語音辨識技術的先驅。」

李琳山
李琳山長期研究華語的辨識,對中文語音輸入服務有巨大的貢獻,他並於2016年獲得中研院工程領域的院士榮銜。|Photo credit: Nature

走一條不同的路,不賺錢也沒關係

他在2016年接受《科學月刊》時表示,他因為有獎學金的緣故,到史丹佛大學讀人造衛星通訊,他說大學時許多台大電機系學長們都因為台灣當時幾乎沒有電機相關產業,最後都選擇在美國落地生根,「但我不想和他們一樣,我想走一條不同的路:回台灣。」

而回到台灣之後,他回母校任教,偶然接觸到一本關於語音處理的教科書,他一邊教一邊讀,等到學期結束才弄清楚教科書裡的內容,這是他後來做華語辨識的起頭。

李琳山說,在那個時代,語音辨識的研究多集中在英文,英文只要使用26個字母就可以表達所有意思,因此有許多研究者投入。相較之下,中文的語音高達1千多個,常用字有一萬多個,構成的詞則是有千千萬萬,要如何有系統地整理,是一大難題。

當時的硬體設備也很原始,李琳山指出,那時市面上沒有語音訊號數位化的電路,必須自己買元件設計電路,最早的系統也因為記憶體很有限,無法儲存一句完整的話。加上微處理器的計算量非常小,一個指令得跑上半天,但語音的處理必須即時,一秒鐘的話得一秒鐘處理完,否則後面講的話就來不及分析。

李琳山說,現在大公司如Apple、Google、Microso‑等所用的華語辨識架構,幾乎和他們當年用的架構是一樣的。只是他們有了雲端及大量的運算及記憶體、大量的數據及一些尖端技術的加持,可以提高辨識精確度,讓消費者喜歡使用。當時他曾想過要把技術轉移給國內產業,合作發展中文語音辨識系統,不過當時行動通訊系統並不普及,而且技術上也有諸多限制,因此一直都沒有成功。