鐵甲奇俠AI管家成真!fb教主用100小時創造「Jarvis」

鐵甲奇俠AI管家成真!fb教主用100小時創造「Jarvis」
Photo Credit:Mark Zuckerberg
我們想讓你知道的是

最終,他想提升的是Jarvis學習能力,達到能夠自學的水平。並且進一步能開源 。

唸給你聽
powered by Cyberon

(中央社)臉書創辦人朱克伯格(Mark Zuckerberg)今天表示,他研發出具人工智慧,名為「賈維士」(Jarvis)的軟體「butler」已經上線,包含他家中都在使用。

朱克伯格今年投入這項個人專案,花了約100個小時,研發這套從電影「鐵甲奇俠」(Iron Man)得到靈感的軟體,在鐵甲奇俠中有個虛擬管家叫「賈維士」(Jarvis),可幫忙管理所有家務。

朱克伯格在自己的臉書上說:「就某方面而言,這項挑戰比我先前預期來得簡單。」

「事實上,我慢跑的挑戰花的全部時間還可能更多(我打算2016年內跑365英里)。」

Jarvis並非實體機器人,但透過這個軟體,朱克伯格用他的手機或電腦,就能控制家中的燈光、溫度、音樂、保全、相關設備等等。據朱克伯格說,這個軟體可學習他的品味與行為模式,包含新字與概念,甚至可娛樂他1歲的女兒邁克斯(Max)。

朱克伯格專門發了一篇部落格文章,詳細介紹Jarvis是怎樣搭建起來的:

未命名
Photo Credit:Mark Zuckerberg

他談到「Jarvis」智慧管家使用的人工智慧技術,包括自然語言處理、語音識別、物體及臉部辨識以及強化學習,以Python、PHP、Objective C語言編寫。

他於網誌中表示,原本預期透過這項挑戰,學習AI技術與工具,但過程中同時也更了解家庭自動化的概況,及親身接觸Facebook工程師使用的各種內部技術工具。

如果我們將Jarvis看成一台電腦,就會發現中間的藍色方塊是Jarvis伺服器,可以理解為處理器+硬盤;右邊的是操作界面,包括Messenger聊天機器人、iOS語音控制應用,攝影機等等;下面的三塊是運行在伺服器裡的幾種技術,包括自然語言處理、語音識別、視覺和臉部識別以及強化學習(reinforcement learning)等,就相當於電腦裡運行的操作系統;左邊的一排則是Jarvis可以控制的電器種類,就像是在電腦上跑的程式。

15419743_10103347287954901_2744013366467
Photo Credit:Mark Zuckerberg

他文章裡提到,當自己為了Jarvis親手開始寫代碼的時候,才發現用一個系統去控制這麼多系統有多難:每個系統的語言都不一樣,協議五花八門;有些電器已經聯網了,有些則除了物理開關之外,根本沒有控制的interface。

比方說,他需要用文字指令控制烤麵包機,首先需要一個能聯網的烤麵包機……但這樣的烤麵包機根本找不到。最後,他不知道從哪兒翻出來一個上世紀50年代的麵包機,然後自己給它裝了一個能聯網的開關。

另外他也談到了「自然語言的複雜性」

他說Jarvis的語言理解能力是分兩階段實現。

首先,他要讓 Jarvis 能理解文字,比如「臥室」、「燈光」、「開」和「關」等常用的關鍵詞,以及能在聽到過去沒聽到過的詞,比如Spotify上的歌名或音樂人的時候,能夠根據語境去對應的服務/設備上搜索並完成任務。

第二階段則是開發一個語音轉文字的系統,才能讓Jarvis的自然語言處理能力達到某種水平現。

他介紹道 ,Jarvis的上下文語境結合能力已經達到了自己可以接受的標準。比如,當他對Jarvis發出「打開我辦公室的空調」指令時,系統能夠正確地打開他的空調,而不是打開他妻子的空調。

再比如,他告訴Jarvis「給我來點音樂,」結果一開始播放的音樂太勁爆,他又告訴Jarvis「這個感覺不對,給我點輕鬆的。」Jarvis 能理解語境函數是「放音樂」,變量是「音樂」,值是「輕」,進而正確完成任務。

15585306_10103347843287011_1483578233804
Photo Credit:Mark Zuckerberg
其他還有像是「視覺和臉部識別」

首先,也是最重要的任務,是識別訪客。他在自家門口裝了幾個不同的攝像頭,從各個角度拍攝門口畫面。當訪客來到時,系統首先識別到門口有人便啟動識別程序,捕捉訪客的人臉細節,進而通過Facebook人臉數據庫識別訪客是誰。

電腦視覺也可以拿來幫他判斷女兒何時醒來,就可以開始播放音樂或華語課程;也可以判斷人正在屋內何處,AI就能正確回應像「開燈」這樣缺乏環境線索的指令。

他提到AI系統擁有的線索資訊越多,整體就越聰明。視覺辨識對於提供語言表面的指令之外的環境線索相當有幫助。\

15591179_10103347986300411_2605551985241
Photo Credit:Mark Zuckerberg
「文字訊息」也很重要

為了能從任何地方透過手機與Jarvis進行溝通,他利用自家的Messenger架構,開發Jarvis對話機器人,發送文字或語音,就會立即轉發到伺服器處理、執行命令。出乎他意料的是,相較於語音,使用文字訊息溝通的情況比預期多得多,主因是簡訊比較不會干擾旁人,Jarvis傳來的訊息也可以等想看時再看。

他提到,喜歡文字通訊大於語音通訊的偏好,符合在Messenger與WhatsApp觀察到的狀況,全世界的文字訊息比語音通訊量增長更快。未來AI產品不能僅專注於語音,還是需要私人訊息介面。

最後他還提到不少自己在開發中的心得,讀者可以自行到部落格內文中一探究竟。

他隨後也接受媒體FastCompany獨家採訪,並公布一小段「賈維斯」智慧管家的影片。

最終,他想提升的是Jarvis學習能力,達到能夠自學的水平。

當然,他也在考慮通過什麼方式能讓Jarvis為更多人所用。簡單的開源肯定不行,因為現在的系統和代碼和朱克伯格家的系統綁定的太深了。

「如果我能開發一個抽象的控制層,也許我會把它開源的。當然,它會變成一個新產品也說不定。」朱克伯格最後在文章裡寫道。

相關報導