讀不懂考題的機器人,未來有可能取代翻譯工作嗎?

讀不懂考題的機器人,未來有可能取代翻譯工作嗎?
Photo Credit:AP/達志影像

我們想讓你知道的是

2011年,日本的國立情報學研究所曾經推動了一個用AI技術讓電腦挑戰日本的大學入學考試的研究計畫,電腦參加大學入學考試的一大難關是電腦無法理解考題內容。

最近幾年,日本常常有關於今後10至20年間可能會消失的職業的話題。

由於現在AI技術越來越進步,所以將來電腦有可能取代很多現存的職業。例如自動駕駛技術成熟後,電腦就可能取代鐵路和公路的車輛駕駛的工作。另外,電腦可以在一瞬間處理非常複雜的計算,而且幾乎不會出錯,所以銀行的業務員也可能被電腦取代。

這一類預測「可能會消失的職業」的報導非常多,每篇報導提到的職業都大同小異。這些「可能會消失的職業」的共通特徵就是「照著規則形式化作業。」

最近,有一部分報導把「翻譯」也列入「可能會消失的職業」。其實不只是媒體報導,有幾位我有在關注的日本社會評論家也認為今後「翻譯」這門工作可能會被電腦取代。他們的立論根據是AI技術越來越進步,IT企業可以透過網路蒐集龐大的文字資料,也可以透過聲控服務蒐集人類的語音資料。有了這些巨大資料,電腦在不久的將來就可以理解人類的語言,哆啦A夢的翻譯蒟蒻不再是想像中的工具。

翻譯時不找專業的翻譯人員,直接用電腦自動翻譯。其實這不能算預測,因為是現實中早就存在的事實,而且是十年前就已經是事實了。至於「電腦在不久的將來可以理解人類的語言」,則只是一部分媒體和評論家的浪漫的想像而已。

我在2008年曾經寫過〈自動翻譯機的浪漫〉〈翻譯軟體的能力極限〉兩篇文章,提到電腦的自動翻譯有很多缺陷。不過當時已經有很多人在用電腦的自動翻譯,儘管當時電腦翻出來的內容多半不像句子。

2018年的現在,電腦自動翻譯的品質明顯比十年前進步。十年前的自動翻譯翻出來的結果不像句子,現在的自動翻譯翻出來的結果比較像句子。不過電腦翻譯的基本原理還是和十年前一樣,就只是詞彙轉換和句子重組。只是以前的電腦是用文法規則來組句子,現在的電腦是參考大量語言範例來組句子。

由於目前這個世界上還沒有人想得出讓電腦理解人類語言的方法,所以開發翻譯系統的人做的不是讓電腦理解人類語言,而是用統計學的技術讓電腦參考大量例句,把轉換後的詞彙拼湊成比較自然的句子,所以現在電腦翻出來的句子比以前自然。不過詞彙轉換過程中必然會失真,如果原文夾帶了任何模糊語氣或暗示的話,翻譯的精度會更低。所以現在的電腦翻譯出來的句子的等級還是「僅供參考」。

今後20年,這個世界上恐怕還是造不出優質的自動翻譯系統。

2011年,日本的國立情報學研究所曾經推動了一個用AI技術讓電腦挑戰日本的大學入學考試的研究計畫。計畫的主題是「機器人進得了東大嗎?」具體而言,就是動用目前最新的技術讓電腦去考大學入學考試的摸擬考。考試的方法是把模擬考題的資料輸入電腦,讓電腦回答,然後和其他參加模擬考的高中生比成績,推算出電腦大概可以考上什麼學校。

這個計畫動員了上百名專業人士。一半是大學的學者和研究生,一半是民間企業的研究員。這個計畫本來是十年計畫,不過做了五年就中止了。因為大家得到結論,確定目前最先進的技術無法讓電腦考上東大,再多做五年也不會變。

電腦參加大學入學考試的一大難關是電腦無法理解考題內容。技術人員要做的是教電腦從考題的文字種類及排列組合特徵來推論「考題可能在問什麼」,然後讓電腦湊答案。舉例來說,負責數學科的技術人員是研究數學考題的文字特徵,分類成幾何代數型、統計型、數列型考題,然後讓電腦從題目中的數字來湊出可能的答案。負責歷史科的技術人員則是讓電腦從考題的各選項的關鍵詞分析出題目可能的形態,然後再比對題目的特徵,把相關性最高的選項當作答案。只從關鍵詞來推論考題內容非常不容易,不過技術人員還是找到了高精度的推論方法,讓電腦在數學和歷史科得了高分。

不過這種技術只適用於「日本的大學入學考試中的敘述比較形式化的考題」而已。國語和英語科的閱讀型考題的文章沒有固定的形式,無法從關鍵詞推論考題內容,而且閱讀測驗無法用計算或形式化的知識解題,所以電腦得不了高分。

日本的大學入學考試的國語科閱讀測驗的形式是讓考生看一篇文章。文章裡有幾段話的旁邊有畫線。考題就是問這幾段話的意義,然後讓考生四選一或五選一。由於電腦無法理解文章的意義,而且技術人員找不到有效的解題方法,所以最後負責國語科的技術人員是用計算文字量的方式讓電腦猜答案。具體而言就是計算文章中畫線句子中的文字種類及數量,以及該句子前一個段落中的文字種類及數量,當作參考基準。然後再計算各選項中的文字種類及數量,和參考基準比較。作答時就是讓電腦選和數值最接近參考基準的選項。

這種解題方法實質上和占卜差不多。不過這一招讓電腦的猜答案的正確率達到五成。這個方法是技術團隊試過的所有方法中得分最高的方法。不過因為本質上是猜答案,所以不論怎麼改良,成績永遠停留在猜答案的水準。

英語科考試中,英語科的技術人員一開始是給電腦3,300萬個英文例句資料。電腦在練習考古題時,英文句子重組問題的答題正確率達到八成。不過實際考摸擬考時,由於題目加了一點變化,電腦無法應付,結果三題中只答對一題,正確率掉到三成三。

之後,技術人員把英文例句資料加到19億個,這時候電腦才能答對大部分的英文句子重組問題。也就是說,19億個英文句子的範例資料可以讓電腦造出比較正常的句子。不過遇到英文會話測驗時,電腦的答題正確率就落到四成。後來技術人員又把英文例句資料提升到150億個,還讓電腦深層學習,狀況還是沒有明顯改善。研究團隊證明了巨大資料和深層學習在處理語言資料時並非萬能,無法讓電腦理解語言的意義。


猜你喜歡


【影音】整理數十萬張空拍影像,就像一場馬拉松:看見・齊柏林基金會「數位典藏」計畫

【影音】整理數十萬張空拍影像,就像一場馬拉松:看見・齊柏林基金會「數位典藏」計畫
Photo Credit:TNL Brand Studio

我們想讓你知道的是

「透過影像為環境發聲」是齊柏林畢生在做的事,也是看見・齊柏林基金會要接力做下去的事。打造一座把台灣存起來的影像資料庫,讓齊柏林留下的影像資產得以傳承世代,「數位典藏」計畫需要你我一同支持響應。

2017年,《看見台灣》的導演齊柏林匆匆離開這個世界,留下無數珍貴空拍影像資產;這些跨越1990年代到2017年、長達25年台灣自然與人文地景變遷的真實紀錄,不只保留了台灣之美,更在學術研究、環保倡議和環境教育上有著無可取代的價值。然而,龐大的影像素材需要經過「數位典藏」才能被有效應用,因此「看見・齊柏林基金會」成立的初衷,就是為了承接數位典藏的使命,讓齊導畢生的心血,能夠世代傳承,發揮永續的影響力。經過兩年的摸索,基金會最終研擬出最合適的數位典藏計畫,不只將齊導作品數位化、分類歸檔,更要建置線上影像資料庫,並將繼續記錄台灣的使命傳承下去。

根據看見・齊柏林基金會統計,齊柏林導演在空中拍攝超過2500小時所累積的影像,約為10萬張空拍底片、50萬張數位照片,上千小時的空拍影片;要為如此龐大的影像資料建檔與整理,勢必耗費許多金錢、時間與人力。不過,只要能集結眾人之力,這一場數位典藏人員及專業志工接力的馬拉松,將會是美麗而撼動人心的一段旅程。

「數位典藏」做什麼?

數位典藏(digital archive),意思是將有保存價值的實體或非實體資料,透過數位化(諸如攝影、掃描、影音拍攝、全文輸入等)與加上屬性資料等詮釋資料(Metadata),建立數位檔案的形式,作為永久保管儲存。

而看見・齊柏林基金會的數位典藏計畫可分為三大工作線,分別為:

  • 傳統底片組:挑選底片→掃描成數位檔案→建立屬性資料→歸檔
  • 數位照片組:挑選照片→建立屬性資料→歸檔
  • 空拍影片組:挑選影片→建立屬性資料→歸檔

除了要將齊導留下來的影像作品數位化歸檔,數位典藏計畫還包括改版建置「iTaiwan8影像資料庫」,也就是建設完整的線上影像資料庫系統,讓齊導作品更便於靈活運用,也能讓更多世人看見。

飛行2500小時累積的空拍影像,怎麼整理?

  • 整理底片/數位掃描

數位典藏組專員詹宇雯的工作,是負責整理傳統底片。即便存放在防潮櫃中,傳統底片仍面臨逐漸老化褪色的壓力,需要與時間賽跑進行數位化保存;然而大多未經篩選的10萬張底片,有些因為直升機震動導致些微的畫面模糊,也有因飛行路線連續較重複的地景構圖,而詹宇雯的其中一項任務,就是拿著放大鏡一一檢視精挑,並標註定位和勘誤照片資訊。

「整理底片最常發生的問題就是人工出錯,因為以前留下的資料可能是齊導或其他志工整理出來、用手寫的,貼紙可能貼錯或資料寫錯。」詹宇雯說起某次經驗,當時有一張台北車站的照片被貼了很多年份,為了找出正確年份,她試圖辨識照片裡招牌跑馬燈上的氣溫、股市市值等資料,交叉比對推斷出正確年份。雖然偶有這種偵探辦案一樣的趣事,但大多數時候是耗費專注度與眼力的過程。

完成底片挑選的階段,接著進到底片掃描數位化。然而,這步驟並不容易,除了整體的影像品質控制與檔案管理,齊柏林導演留下的底片最遠距今至少11年,老化褪色的底片容易出現色彩偏誤,須進行色彩還原,再修掉畫面上的髒點、存成解析度高的數位影像才算完成。

image3
Photo Credit:TNL Brand Studio
整理傳統底片的過程,必須拿著放大鏡一一檢視精挑,標註定位和勘誤照片資訊。
  • 建立屬性資料

所謂「建立屬性資料」,其實就是為影像添增各種描述紀錄的資訊,有了這些資訊,龐大的影像資料才能被有效率的搜尋、管理。數位典藏組副組長陳宣穎表示,以齊導拍攝的影像為例,包含:拍攝主題、地點及詮釋地景的關鍵字都屬於此範疇;而其中投入最多時間的便是「定位」和「建立關鍵字」這兩項任務。

「定位」指的是找出拍攝主體所在地點和座標,有時可透過既有的飛行軌跡紀錄來推測,但更多時候是在沒有軌跡紀錄的狀態下,憑藉地理知識及照片上的蛛絲馬跡判讀位置。如果影像拍攝年代久遠,或是地景變化很大,就需要運用更多歷史圖資或佐證資料去搜索、推論。

「我們要一張一張照片判讀,建立屬性資料。像是早期的傳統相機沒有定位功能,常常看到照片中只有一大片山稜線,此時我們就要仔細比對地圖、衛星影像,想辦法查找,盡可能貼近正確。」陳宣穎說。

「建立關鍵字」看起來似乎相對輕鬆,然而事實上,光是決定有哪些關鍵字可以使用,就是一門功夫。第一步必須辨認影像中的景物,例如一塊農田種植的是什麼作物,就必須蒐集其他資料輔助判斷;其次,由於空拍照片尺度不一,在畫面中佔比多大的景物需要設立關鍵字,也需要經過討論訂定規則;最後,還必須從使用者的角度思考,依據一般人的搜尋習慣設立關鍵字。

因此,在建立屬性資料的過程中,看見・齊柏林基金會也特別諮詢多位專家,共同研究規劃出適合台灣空中影像的關鍵字建置邏輯,並以此基礎進行分門別類、校正檢核,確保影像被妥善歸納及運用。

image2
Photo Credit:TNL Brand Studio
建立屬性資料時需要大量對比地圖,並依照訂定好的規則建立屬性資料,使歸納邏輯一致。
  • 影音資料典藏

相較於照片整理,動態影片的典藏工程更為多元複雜。首先,要針對近千小時空拍影片進行盤點,接著進行特殊格式轉檔與備份,再逐步建立邏輯編碼、標示檔案管理方式,以推動後續屬性資料建立。

「影片整理最大的兩個挑戰,其一是影片內容橫跨的範圍很大,導演可能是台中起飛、屏東降落,因此要去判斷每個影片節點的地景定位;其二是飛機上升的垂直範圍很大、晃動又劇烈,有時候會遇到『果凍效應1』致使內容失真。」影音製作組專員鄭宇程說明,由於各時期的影片拍帶檔案格式、影像內容品質、影片時長都不同,大大增加了管理建檔難度。

image4
Photo Credit:TNL Brand Studio
影音資料的典藏,需要讀取大量的檔案,逐格檢視、分段建立屬性資料、調色等。

加入數位典藏的馬拉松,傳承接棒台灣之美

從一步步定義操作流程、統一色彩管理語言、購置影像處理設備等,到培訓志工與實習生、讓人力支援一步到位、避免巨量資料的協作過程中出現錯誤,都是數位典藏計畫的範疇。多元內容創意部副總監王俐文表示,「數位典藏」四個字說來簡單,但過程繁複龐雜,需要所有人一致的專注、耐心、細心、以及熱忱。

「iTaiwan8影像資料庫」作為看見・齊柏林基金會數位典藏計畫的目標之一,改版上線只是第一步,接下來除了完成龐大影像資料的典藏,更大的挑戰是要繼續記錄台灣,讓影像不會只停留在2017年。

「透過影像為環境發聲」是齊導畢生在做的事,也是基金會要接力做下去的事。而數位典藏計畫,就是齊導生命的延續,也是基金會動力的源頭。要打造一座把台灣存起來的影像資料庫並不容易,看見・齊柏林基金會亟需各界的支持,共同建置屬於台灣最美的影像資料庫。讓我們一起守護齊柏林留下的影像資產,讓土地脈動的珍貴影像得以傳承世代,發揮更多價值。

捐款支持看見・齊柏林基金會,透過影像為環境發聲


註1:果凍效應(rolling shutter)是數位相機CMOS感光元件的一種效應,當使用電子快門來拍攝高速移動的物件時,原本垂直的物件拍攝出的畫面卻為傾斜甚至變形。(資料來源:維基百科)


猜你喜歡