輸入文字,微軟AI「無中生有」幫你畫出來

輸入文字,微軟AI「無中生有」幫你畫出來
Image Credit: Microsoft

我們想讓你知道的是

研究人員表示,這個AI產生器可以用來增強攝影師的影像編輯工作,或者當藝術家的繪圖助理。

文︰Mia

近年人工智能(AI)在各領域表現大幅躍進,不管是作曲 、 建立另一個AI,成果都相當讓人刮目相看前陣子京都大學發表了可以「讀心」的AI, 從無到有還原受試者正盯著的影像。現在微軟 AI 又在影像領域產生了新的突破,能夠看完文字敘述以後自己「畫圖」。

跟Google的Sketch RNN真的要訓練電腦「畫」出具題而複雜的物件不同,微軟AI相較起來可能是個比較小的挑戰:他可以把文字敘述轉變成一幅畫。

微軟的AI產生器名為Attentional Generative Adversarial Network(AttnGAN)。當然現在用文字來搜尋符合敘述的現成圖片已經不稀奇了,不過微軟除了教AI什麼樣的文字特徵與什麼樣的圖像配對以外,在論文中還提到,他們的AI史無前例地能夠從文字中過濾出不同的條件,用來產生畫面中不同的部位。

drawing-bot-feature-2
Image Credit: Microsoft

舉例來說,如果輸入「這隻鳥有綠色的頭冠、黑色的基底和白色的肚子」,電腦就會一個像素一個像素地重建出一幅相當精準的影像。

主要研究員何曉冬在新聞稿中解釋到,差別在於「如果你用 Bing 搜尋一隻鳥,你就得到一隻鳥的圖片,但是在這裡電腦則是無中生有,一像素一像素地創造出這個影像。」

研究人員表示,這個AI產生器可以用來增強攝影師的影像編輯工作,或者當藝術家的繪圖助理。在新聞稿中還提到,也許未來甚至能直接從文字劇本生成動畫電影。

參考資料︰

本文經作者授權刊登,原文發表於

相關文章︰

核稿編輯︰鄭家榆