【影音】祖克柏也擁有了「鋼鐵人的智慧管家」,沒想到「管家本人」竟然是他

【影音】祖克柏也擁有了「鋼鐵人的智慧管家」,沒想到「管家本人」竟然是他
我們想讓你知道的是

飾演鋼鐵人Tony Stark 的小勞勃·道尼曾經出聲表達意願,不過同時間摩根費里曼也成為許多民眾點名獻聲的對象。

唸給你聽
powered by Cyberon

(中央社)臉書創辦人祖克柏(Mark Zuckerberg)今天表示,他研發出具人工智慧,名為「賈維士」(Jarvis)的軟體「butler」已經上線,包含他家中都在使用。

祖克柏今年投入這項個人專案,花了約100個小時,研發這套從電影「鋼鐵人」(Iron Man)得到靈感的軟體,在鋼鐵人中有個虛擬管家叫「賈維士」(Jarvis),可幫忙管理所有家務。

祖克柏在自己的臉書上說:「就某方面而言,這項挑戰比我先前預期來得簡單。」

「事實上,我慢跑的挑戰花的全部時間還可能更多(我打算2016年內跑365英里)。」

Insider報導,而摩根費里曼除了是 Google 導航 App「Waze」裡面的指路人之外,現在還多了一個身份就是祖克柏的智慧管家。

今年10月14號,Mark Zuckerberg就曾在Facebook上公開徵詢大家的意見,誰適合為他的智慧家管獻聲。

甚至當時飾演鋼鐵人Tony Stark 的小勞勃·道尼曾經出聲表達意願,不過同時間摩根費里曼也成為許多民眾點名獻聲的對象。

祖克柏告訴記者 ,其實一開始他也沒想過最後會是摩根費里曼,但因為許多人的推薦,再加上他又在由自己與各個矽谷科技名人創立,有「科學界奧斯卡」美譽的突破獎(Breakthrough Prizes)上看到摩根費里曼。於是,他打了通電話,詢問摩根費里曼的意願,當時對方欣然答應了。

祖克柏10小時前才剛發布影片,親自介紹Javis:

祖克柏的妻子也分享使用體驗:

Jarvis並非實體機器人,但透過這個軟體,祖克柏用他的手機或電腦,就能控制家中的燈光、溫度、音樂、保全、相關設備等等。據祖克柏說,這個軟體可學習他的品味與行為模式,包含新字與概念,甚至可娛樂他1歲的女兒邁克斯(Max)。

祖克柏專門發了一篇部落格文章,詳細介紹Jarvis是怎樣搭建起來的:

未命名
Photo Credit:Mark Zuckerberg

他談到「Jarvis」智慧管家使用的人工智慧技術,包括自然語言處理、語音識別、物體及臉部辨識以及強化學習,以Python、PHP、Objective C語言編寫。

他於網誌中表示,原本預期透過這項挑戰,學習AI技術與工具,但過程中同時也更了解家庭自動化的概況,及親身接觸Facebook工程師使用的各種內部技術工具。

如果我們將Jarvis看成一台電腦,就會發現中間的藍色方塊是Jarvis伺服器,可以理解為處理器+硬盤;右邊的是操作界面,包括Messenger聊天機器人、iOS語音控制應用,攝影機等等;下面的三塊是運行在伺服器裡的幾種技術,包括自然語言處理、語音識別、視覺和臉部識別以及強化學習(reinforcement learning)等,就相當於電腦裡運行的操作系統;左邊的一排則是Jarvis可以控制的電器種類,就像是在電腦上跑的程式。

15419743_10103347287954901_2744013366467
Photo Credit:Mark Zuckerberg

他文章裡提到,當自己為了Jarvis親手開始寫代碼的時候,才發現用一個系統去控制這麼多系統有多難:每個系統的語言都不一樣,協議五花八門;有些電器已經聯網了,有些則除了物理開關之外,根本沒有控制的interface。

比方說,他需要用文字指令控制烤麵包機,首先需要一個能聯網的烤麵包機……但這樣的烤麵包機根本找不到。最後,他不知道從哪兒翻出來一個上世紀50年代的麵包機,然後自己給它裝了一個能聯網的開關。

另外他也談到了「自然語言的複雜性」

他說Jarvis的語言理解能力是分兩階段實現。

首先,他要讓 Jarvis 能理解文字,比如「臥室」、「燈光」、「開」和「關」等常用的關鍵詞,以及能在聽到過去沒聽到過的詞,比如Spotify上的歌名或音樂人的時候,能夠根據語境去對應的服務/設備上搜索並完成任務。

第二階段則是開發一個語音轉文字的系統,才能讓Jarvis的自然語言處理能力達到某種水平現。

他介紹道 ,Jarvis的上下文語境結合能力已經達到了自己可以接受的標準。比如,當他對Jarvis發出「打開我辦公室的空調」指令時,系統能夠正確地打開他的空調,而不是打開他妻子的空調。

再比如,他告訴Jarvis「給我來點音樂,」結果一開始播放的音樂太勁爆,他又告訴Jarvis「這個感覺不對,給我點輕鬆的。」Jarvis 能理解語境函數是「放音樂」,變量是「音樂」,值是「輕」,進而正確完成任務。

15585306_10103347843287011_1483578233804
Photo Credit:Mark Zuckerberg
其他還有像是「視覺和臉部識別」

首先,也是最重要的任務,是識別訪客。他在自家門口裝了幾個不同的攝像頭,從各個角度拍攝門口畫面。當訪客來到時,系統首先識別到門口有人便啟動識別程序,捕捉訪客的人臉細節,進而通過Facebook人臉數據庫識別訪客是誰。

電腦視覺也可以拿來幫他判斷女兒何時醒來,就可以開始播放音樂或華語課程;也可以判斷人正在屋內何處,AI就能正確回應像「開燈」這樣缺乏環境線索的指令。

他提到AI系統擁有的線索資訊越多,整體就越聰明。視覺辨識對於提供語言表面的指令之外的環境線索相當有幫助。\

15591179_10103347986300411_2605551985241
Photo Credit:Mark Zuckerberg
「文字訊息」也很重要

為了能從任何地方透過手機與Jarvis進行溝通,他利用自家的Messenger架構,開發Jarvis對話機器人,發送文字或語音,就會立即轉發到伺服器處理、執行命令。出乎他意料的是,相較於語音,使用文字訊息溝通的情況比預期多得多,主因是簡訊比較不會干擾旁人,Jarvis傳來的訊息也可以等想看時再看。

他提到,喜歡文字通訊大於語音通訊的偏好,符合在Messenger與WhatsApp觀察到的狀況,全世界的文字訊息比語音通訊量增長更快。未來AI產品不能僅專注於語音,還是需要私人訊息介面。

最後他還提到不少自己在開發中的心得,讀者可以自行到部落格內文中一探究竟。

他隨後也接受媒體FastCompany獨家採訪,並公布一小段「賈維斯」智慧管家的影片。

最終,他想提升的是Jarvis學習能力,達到能夠自學的水平。

當然,他也在考慮通過什麼方式能讓Jarvis為更多人所用。簡單的開源肯定不行,因為現在的系統和代碼和祖克柏家的系統綁定的太深了。

「如果我能開發一個抽象的控制層,也許我會把它開源的。當然,它會變成一個新產品也說不定。」祖克柏最後在文章裡寫道。

相關報導

或許你會想看
更多『新聞』文章 更多『科技』文章 更多『羊正鈺』文章
Loader