《深度學習的商戰必修課》:能創造出無限多「偶像特徵」假臉的人工智慧

《深度學習的商戰必修課》:能創造出無限多「偶像特徵」假臉的人工智慧
Photo Credit: 臉譜
我們想讓你知道的是

2018年6月,該公司宣布研發創意人工智慧的應用軟體「偶像自動生成AI」。藉由學習了偶像臉孔特徵的人工智慧,來生成虛擬的偶像臉孔。因為有無限多變化,可以創造出擁有「偶像臉孔特徵」的人臉。

唸給你聽
powered by Cyberon

文:日經xTREND

實現自動生成「偶像臉」,目標是創意人工智慧實用化

位於京都的新創公司DataGrid持續研發將創意人的工作交給人工智慧的「創意人工智慧」。

該公司提出未來全新的人工智慧運用方式,研發出能「生成」偶像臉孔的人工智慧,作為一項「創意人工智慧」。

提到近年來女性偶像的長相,都是從一大群唱唱跳跳團體之類的印象,浮現「大概是長這樣吧」。於是,藉由深度學習來建立無數種所謂「偶像臉」。來自京都大學的新創企業DataGrid(京都市左京區)研發的「偶像自動生成AI」,正提供這類功能。該公司以高解析度、高品質自動生成虛擬的偶像臉孔,在官網上生成多個臉孔版本,並以影片來介紹連續變化的模樣。每一張變化的臉孔看起來確實都具有偶像的五官,但每一張臉各不相同。而這些都不是實際存在的「某個人」,令人感到不可思議。

DataGrid社長岡田侑貴說明該公司的目標。

「這是2017年在京都大學新創中心(Kyoto University Venture Incubation Center, KUViC)成立的公司,目標是研究開發生成繪畫、設計、音樂等有價值的創作內容的創意人工智慧。一直以來,大眾普遍認為設計師、創意人這類繪畫和文案撰寫的工作,是人類工作中不會被電腦取代的最後堡壘。然而,人工智慧技術日新月異,終究還是能做出可以創作的人工智慧。」其中一項實例是偶像生成AI。

20200115_深度學習的商戰必修課_p256圖
Photo Credit: 臉譜
「偶像自動生成AI」打造的虛擬偶像圖像

岡田繼續說明,「講到以往的人工智慧,幾乎都用來辨識、預測,很少看到創作的人工智慧。DataGrid希望藉由讓人工智慧做創意人的工作,刺激創意人的想像力,打造一個人類與人工智慧共同創作的社會。公司裡的11名員工全都具備機器學習的專業背景,在學術上也與大學展開共同研究。另外,商業面上用創意人工智慧的成果,建立起能夠授權企業的商業模式。」

以深度學習來辨識偶像的特徵

2018年6月,該公司宣布研發創意人工智慧的應用軟體「偶像自動生成AI」。這項作業的概要,是讓運用深度學習的人工智慧以幾萬張偶像大頭照來學習,使人工智慧辨識出偶像的特徵。藉由學習了偶像臉孔特徵的人工智慧,來生成虛擬的偶像臉孔。因為有無限多變化,可以創造出擁有「偶像臉孔特徵」的人臉。

在具體的手法上,使用的是「生成對抗網路」(generative adversarial network, GAN)。生成對抗網路是一種非監督式學習模型,從不給予正確答案的學習資料中,推導出結構和規則,並「生成」影像等成果。其中一個網路是試圖接近從給予的學習資料所獲得的資訊,另一個是判別真偽的網路,藉由兩者在互相對抗之下各自提高準確率,提升要求的影像等生成物的品質,因此以「對抗」為名。

岡田建立使用生成對抗網路的人工智慧模型,成功將偶像臉孔特徵做出頸部以上的高解析度(1024×1024)影像,但研發過程中面臨意想不到的狀況。

岡田:「一開始使用偶像臉孔的影像來學習時,雖說看得出是臉部,但生成的大多是輪廓不完整的怪臉孔。其中一個原因是起初的資料量比較少,大概只有5000筆。另一方面,偶像的大頭照形形色色,有些影像中配戴了髮飾,或者比出勝利手勢,還有臉轉向側面的,因此有時頭髮上出現莫名其妙的圖案。最後增加了幾萬筆學習資料,在資料上有絕對的優勢,不過我深深體會到針對資料進行預處理,修正為適合學習的型態,這一點非常重要。」

有了資料的預處理,加上自由度高的學習模型最佳化,並且有後處理(posttreatment)的機制,評估生成的影像,只留下好的顯示為成果。費盡心思,終於完成了偶像自動生成AI。

經過一番努力研發出的偶像自動生成AI,現階段還沒有明確的用途。岡田說明,不只是目前的「臉孔」,希望能用人工智慧來生成動態的虛擬偶像「全身」。這麼一來,在很多情境下都能以虛擬偶像來替代真人上場。岡田:「出現在電視廣告中的人物或電商服飾模特兒,未必一定得是真人。如果能用人工智慧模特兒來替代真人藝人,想降低成本的廣告或電商網站就能使用虛擬人物。」即使因為成本而無法採用真人,生成高解析度且幾近真實的人物影像,同樣帶來新的創意。

生成「擬真影像」的技術有什麼用處?

使用生成對抗網路生成新資料的人工智慧,可說是DataGrid的核心技術。換言之,DataGrid的業務不只是偶像自動生成。

另一個接近偶像自動生成的領域是「內容(contents)自動生成」。運用生成對抗網路,以動畫人物或電玩遊戲中使用的地下迷宮(dungeon)作為學習資料建立模型,生成前所未有的「具備動畫人物特徵的影像」或「具備電玩遊戲地下迷宮特徵的圖形」。如果有效運用這類人工智慧,就不必像現在人工作業繪製一個個動畫人物,只要用生成對抗網路一次生成多個人物,然後「挑選」出來。

比方說,使用能生成無數個人物的特徵,在電玩遊戲中針對每個玩家有不同的客製化人物。

事實上,經營線上電玩遊戲的Aeria 便投資了DataGrid,共同推動以人工智慧生成人物影像的專案。目前除了規畫提供利用這項技術的電玩遊戲,未來還預計發展出讓人工智慧辨識玩家喜好並配合生成遊戲人物。

不只生成影像,還能應用於加工。「把照片變成梵谷名畫」之類廣受歡迎的手機應用程式,很容易建立影像濾鏡功能,根據某些特徵來改變圖像。除此之外,要提高畫質粗劣的影像的解析度,「超解析」(super-resolution)、「降噪」之類影像處理也能有效使用生成對抗網路,目前仍持續研究開發。超解析必須生成原本非以數據存在的畫素資訊,但這種「擬真創作補足」正是生成對抗網路最擅長的領域,「成功實現了比以往超解析更漂亮的超解析影像。」(岡田)降噪方面的成果同樣效果顯著,未來可望應用在影像和照片的數位修復作業或博物館。

20200115_深度學習的商戰必修課_P260圖
Photo Credit: 臉譜
動畫角色也能自動生成無數變化

第三個解決方案是「學習用資料的自動生成」。想在業務上運用人工智慧,想用深度學習打造模型,雖然有這樣的期望,卻礙於收集不到學習用的資料或數量太少,這些情況尋常可見。例如偵測異常的人工智慧,即使有大量正常的影像,通常顯示異常的影像很少。這時可以運用生成對抗網路,生成各種「具備異常特徵的影像」,以這種方式來增加學習用的資料。

岡田:「如果能把100筆資料增加到1萬筆的各種變化,深度學習的準確率大幅提高。工廠內的異常影像、產品品管檢查時發現缺失的影像、行車紀錄器拍到汽車前方有人或動物衝出來的影像等,這些希望借助運用人工智慧的異常影像數量都很少。若以生成對抗網路生成的資料來補充,將有助於建立準確率高的人工智慧模型。」

藉由DataGrid研發的人工智慧,能夠以各種形式「無中生有」。DataGrid和面對課題的夥伴企業共同運用這些功能。岡田表示,「到頭來,人工智慧單打獨鬥什麼事都做不了,重要的是『人工智慧×未知的X』。然而,要靠自己來打造X,工程太浩大。因此,我們希望與已經擁有X的其他公司合作,繼續推動創意人工智慧的實用化。」他非常看好創意人工智慧的未來。

相關書摘 ▶《深度學習的商戰必修課》:好感度較高的廣告,具備什麼樣的特徵?

書籍介紹

《深度學習的商戰必修課:人工智慧實用案例解析 看35家走在時代尖端的日本企業如何翻轉思考活用AI》,臉譜出版
.透過以上連結購書,《關鍵評論網》由此所得將全數捐贈聯合勸募

作者:日經xTREND
譯者:葉韋利

日本AI書籍第一人、東京大學松尾豐教授解說深度學習的發展預測。LINE、可口可樂、本田、樂天、NHK、So-net、佳能醫療系統……第一手訪談先驅者的前瞻思考,掌握智慧化新技術的無限商機。

  • 深入導讀深度學習的發展:影像辨識、多模式辨識、機器人學、互動、符號接地、知識擷取!
  • 為運用AI技術的企業經常遇到的疑問提出解答,次世代新興事業、企業創造價值必讀教本!
  • 直擊AI計畫推動者的挑戰與艱辛,收錄大量照片和圖表,身歷其境感受快速擴展的深度學習應用的今日與未來!
getImage
Photo Credit: 臉譜

責任編輯:朱家儀
核稿編輯:翁世航