人工智慧再進化:電腦新「視」界的開啟

人工智慧再進化:電腦新「視」界的開啟
資料來源:廖弘源

我們想讓你知道的是

我們過去總認為,電腦是工具,只能幫我們處理機械化的工作。但廖弘源博士兩個最新研究之中,都包含著非常複雜的深度學習運算技術,若研發成熟後,人工智慧在影片處理上的技巧,將會突飛猛進。

採訪編輯:黃楷元
美術編輯:張語辰

為什麼要研究「電腦視覺」?「電腦視覺(computer vision)」是研究怎麼讓機器「看」這個世界。在相機、手機、監視器、行車紀錄器等設備無所不在的今天,人類社會中的視訊資料量,前所未有地巨大。中研院資訊所特聘研究員廖弘源與團隊,教電腦懂得偵測、識別、分析這些影像訊息,進而做出判斷或行動,如此可衍生各種重要的應用,如人臉辨識、物件偵測、車輛追蹤、街景分析等。

輕按快門,相機可以快速找到人臉對焦;機場快速通關窗口,機器能在幾秒鐘之內認出你是誰;裝一台攝影機,就可以計算某段時間內有多少人車經過……「電腦視覺」加上「機器學習」技術的進步,讓我們的生活更加安全及便利。

不過,電腦可不是一開始就這麼聰明的。

1
Photo Credit:研之有物
研究電腦視覺及機器學習,設法讓電腦變聰明的廖弘源博士。(攝影:張語辰/圖說設計:黃楷元)

教電腦看世界 特徵辨認第一課

電腦「看」世界的方式,和你我很不一樣。在我們眼中,一張圖畫裡可能有人物有風景。但在電腦「眼」中,卻只是幾萬幾億個不同顏色的小點(其實就是像素,pixel),以某個順序排列起來而已。

2
資料來源:廖弘源
當「人眼看世界」時,可以有邏輯地思考、解釋眼前的人事物。(資料來源:廖弘源)
3
資料來源:廖弘源
但「電腦看世界」時,一棟建築或一個碼頭,在電腦眼中只是一堆像素、或一串位元。(資料來源:廖弘源)

中央研究院資訊所特聘研究員廖弘源,窮畢生之力,都在教電腦怎麼「看」世界:從0與1組合成的數位世界中,找出各種「特徵」、並據此識別出特定的物件,進而判斷視訊資料的意義。

比方說,媽媽今天燙了個捲捲頭回家,爸爸可能會一時之間認不出來,但電腦依然能辨認這位捲髮女士是媽媽,因為五官並沒有改變。廖弘源和研究團隊在2001年發表的論文,探討此一問題,證明「五官特徵」才是電腦辨識人臉的依據,而非五官之外的髮型、衣著、首飾等,此知識讓業界的臉部辨識系統發展地更精準,也成為這領域近廿年來必讀的文獻之一。

以「識別」與「比對」為核心,電腦視覺延伸出很多用途。廖弘源和研究團隊廿多年來開發出了多項創新技術,像是人臉和車牌的辨識系統,現在已是治安保全的重要利器;而數位檔案加上「雞尾酒浮水印」,則可以防範辛苦的智慧結晶被盜用。

妙手回春 老相片老電影重獲新生

2006年起,廖弘源接手另一項艱難任務:「數位典藏與數位學習國家型科技計畫」。面對龐大的數位典藏檔案,首要工作就是快速有效地判讀、註解、並擷取多媒體內容。多媒體資料不只圖片,還包括影片。影片等於是一秒鐘30張圖片串接在一起,再加上聲音,資訊量非常龐大,因此分析難度,跟簡單的圖片不可同日而語。

另外一個大難題是,許多珍貴的老膠捲,有的被蟲蛀、有的甚至發霉了,眼看就要損毀。還好,廖弘源研究團隊成功打出一記「還我漂亮拳」。一連串視訊篡改(video inpainting)的研究,應用在數位修補技術上,成功幫受損的照片或影片「回春」。

先要能「篡改」,才有能力「修復」

什麼是視訊篡改?目的不是要捏造不存在的歷史、或是製造虛構的畫面,但透過「無中生有」的原理,卻可以還原已經被破壞的元素。像下圖照片所示,原本斑駁陳舊,但電腦程式可以自動擷取摺痕周邊的影像資訊,用類似「模擬」的方式,產生出原本不存在於照片上的元素,把缺損給填補起來。

4
資料來源:廖弘源
充滿歲月痕跡的老照片(左),按一個鍵,色調不再泛黃、摺痕也消失無蹤(右)(資料來源:廖弘源/圖說設計:黃楷元)

要修補動態的影片更加困難,廖弘源團隊做出了領先世界的創新研究,採用一種ISOMAP技術,以非線性的方式降低維度,不但減少了影片資料運算所需的記憶容量,還能用空間的轉換,填補上被破壞的片段,讓動作看起來自然而連續。許多發霉的老膠捲、經典電影或相片,在這項技術之下,重獲新生。

5
資料來源:廖弘源
人連續的動作,經過ISOMAP技術進行轉換後,連結連續姿態變化的軌跡。(資料來源:廖弘源/圖說設計:黃楷元、張語辰)  

人工智慧當道 電腦視覺技術突飛猛進

以上所有研究與技術,在2012年遇到了一個重大分水嶺,那就是「深度學習(deep learning)」技術的應用。這是一種類神經網絡研究,也就是用數學模型去模擬生物中樞神經的結構和功能。

早期,這樣的研究受限於電腦運算速度,隨著電腦效能大幅提升,深度學習的成熟也一日千里。日前喧騰一時的Google AlphaGo,就是藉由輸入了無數的棋譜讓電腦進行深度學習,選出最可能獲勝的落子位置,逐一擊敗各國頂尖職業圍棋選手。

而在電腦視覺領域的國際盛會──大規模視覺辨識競賽(Large Scale Visual Recognition Challenge, ILSVRC),主辦單位提供1,000類超過120萬張的影像,讓參賽團隊設計的程式去判斷類別。2010年首次舉辦時,表現最佳的系統錯誤率仍高達28%。但來到分水嶺的2012年,透過深度學習技術,錯誤率大幅降低到16%。2015年更是一舉突破人類極限,錯誤率達到3.7%(人眼辨識的極限是5%),正式宣告,電腦視覺比人類更精準的時代來臨。

廖弘源的研究團隊也著力於此,開展了兩項創新的研究。第一個,是「籃球進攻戰術分析」。電視轉播的球賽,常聽球評或教練,戰術分析得頭頭是道,未來透過深度學習,可以讓電腦直接從比賽的影片中,球員跑動的軌跡,就判讀出這一波進攻是打什麼戰術。

6
資料來源:廖弘源
電腦先擷取球賽的片段,辨認出移動的球員(上圖),然後轉換成平面,測量移動的軌跡與速度(中圖),最後,透過數學函數的分析,比對資料庫,找出相符的戰術(下圖)。(資料來源:廖弘源/圖說設計:黃楷元)

另一個研究則是「演唱會片段自動拼貼(mashup)」。一場演唱會,可能有數百個粉絲,從不同角度、不同距離,拍下了不同片段,上傳到YouTube上。那麼,有沒有可能,讓電腦自動挑出這些片段,然後重新剪輯成高品質的完整演唱會影像呢?這項大工程有許多問題,等著廖弘源研究團隊一一克服。

他們先用深度學習技術,讓電腦分辨影像中的不同物件(歌手、舞台、樂器、觀眾等),接著再用另一套模式(Error-Weighted Deep Cross-Correlation Model, EW-Deep-CCM)對影片的每一個鏡頭進行分類,辨認出是遠景、中景、近景、或是特寫。然後還要比對音訊,整理出影片的正確時間順序。最後,才依照順序、分鏡邏輯、和情緒鋪陳,組合出最佳的影片。

7
資料來源:廖弘源
不同角度、不同距離、不同段落的演唱會影片,混搭拼貼成完整的演出視訊。(資料來源:廖弘源/圖說設計:黃楷元)  

猜你喜歡


當你買房之後 別忘了做這件事! 

當你買房之後 別忘了做這件事! 
Photo Credit:臺銀人壽

我們想讓你知道的是

45歲的王先生剛買了房,未料沒多久就遭遇車禍不幸受傷,住院療養後,所幸並無大礙,但他也因此而感到心驚膽跳。因為上有老、下有小要扶養的他,是家中唯一經濟支柱,萬一真有個閃失,近千萬的房屋貸款誰來承擔?這樣的事件何嘗不是台灣眾多家庭的縮影?

根據聯徵中心資料顯示,2021年平均房貸金額超過700萬元,以35~55歲為大宗,平均貸款金額則介於660~780萬元,再再證明人生責任最沉重的中壯族群,肩負不小的房貸壓力,更應該善用房貸型壽險,為家庭生活添加更可靠的保障,以避免家中頓失經濟來源,原本的幸福生活就此轉折。

房貸型壽險主要針對房貸而設計,所以借款人、要保人及被保險人,須為同一人,屬於定期險,保費較一般終身壽險低,免體檢額度亦可放寬,以臺銀人壽來說, 55歲以下免體檢額度為1,500萬元,56歲~60歲則為1,000 萬元,66歲以上則一律需要體檢。

該如何投保房貸壽險呢?臺銀人壽建議掌握五大重點

一、以家中經濟來源為主要投保對象:優先以肩負「房貸責任」的一家之主為被保險人,當其發生不幸而身故或完全失能,保險公司會將理賠金用來償還房貸,以避免還款壓力落在家人身上,才能預防房屋淪為被法拍的命運。

二、根據家庭責任及經濟能力選擇適合類型:房貸壽險有「平準型」與「遞減型」,差別在於保額是否固定不變。以貸款500萬,貸款20年,保額500萬元,保障期間20年為例,平準型保額固定,理賠金不會隨著房貸償還而逐年減少,直到繳完房貸為止,保額都維持500萬元不變。遞減型保額則會隨著時間而逐年遞減,當房貸還款十年後,房貸從500萬償還到剩下約250萬,相對的保額也會隨時間逐年遞減到約300萬。

若壽險保障不夠或家庭責任重的人,可以選擇「平準型」,保費雖比「遞減型」高,但保障相對較高,適合有經濟能力、且希望給家人多些保障者。若是已有較高壽險保障或家庭責任較輕的人,即可選擇「遞減型」,保費較平準型低,很適合小資族投保,經濟又實惠,較能輕鬆負擔保費。

三、把握足期足額、專款專用:房貸繳多久、繳多少,保額就買多少、保多久,例如房貸500萬元、貸款期限20年,房貸壽險保障最好也是500萬元、保險期間 20年,而且要專款專用,才能讓家人有保障。

四、是否提供加值保障:除了身故或失能理賠金之外,有些房貸壽險還會提供加值保障,除了身故及完全失能保障之外,還加入類旅平險概念,提供特定意外傷害身故保險金(搭乘大眾運輸交通工具)、完全失能扶助金、意外傷害失能安養金、重大燒燙傷等保障,可以說是集結「壽險」、「失能險」、「意外傷害險」等多元保障的保單。

五、選擇優質保險公司:房貸金額高、期限長達數十年,房貸壽險保障必須要能夠長長久久,才能有效規避長期房貸風險,因此,選擇優質保險公司很重要。臺銀人壽為國營品牌,有能力永續經營,且近7年來房貸壽險理賠金已逾上億元,協助許多家庭轉移債務風險、度過難關,獲得了良好口碑,成為許多人房貸壽險的首選。

晉升為有巢族固然欣喜,不過,風險不知道何時會來到,唯有投保了理債保單:房貸壽險,才能「留愛、留房,不留債」。

房貸壽險平準型VS遞減型

平準型 遞減型
特色 理賠金不會隨房貸清償而減少 理賠金隨時間逐年而遞減
保費 較高 較低
適合對象 希望給家人多一份保障者、築巢雙薪族 預算較低者、首購小資族、以房養老族、人生溫拿族

了解更多

臺銀人壽 廣告


猜你喜歡