對答猶如真人的Duplex實際表現如何?Google邀記者親身測試

對答猶如真人的Duplex實際表現如何?Google邀記者親身測試
Google影片截圖

我們想讓你知道的是

早前Google公開其新技術Duplex訂座的電話對答錄音,聽起來非常像真人,同時引起造假的質疑。現在Google讓多名記者親身測試,證實Duplex的能力。

今年5月,Google播放了其人工智能系統Duplex的一段錄音,代用戶致電髮廊及餐廳協助預約訂位,對答、說話方式猶如真人,令人驚訝。不過由於那只是預先錄製好的內容,未有即場示範,Duplex引起一些媒體的質疑,包括倫理及私隱問題——有否告訴對方這是人工智能而非真人,而且會錄下對話內容?

有人甚至質疑Google曾修改錄音,《Axios》指出,Google的示範錄音中髮廊及餐廳職員接電話後第一句話是問「有甚麼可以幫到你」,但記者致電二十多家髮廊及餐廳,幾乎所有都立即說出公司名字,亦沒有詢問客戶電話或其他聯絡資料。此外,記者致電時都聽到風筒或杯碟造成的背景雜音,卻沒出現在Google的錄音當中。

當《Axios》向Google查詢店家名字時,保證不會公開、只求確認錄音真確,但Google的發言人拒絕透露,並拒絕評論錄音是否經過修改。

記者測試證實Duplex對話能力

日前,Google邀請多名記者化身餐廳職員,接聽Google Duplex的來電,親身測試這個人工智能系統的語音技術及對話能力。根據這些記者的報道,Duplex聽起來的確非常自然,而且雖然他們嘗試引起Duplex犯錯,但它仍然冷靜、有禮。

這一輪的測試禁止錄音,但Google提供了另一段示範影片,而據測試的記者描述,影片中Duplex的對話跟他們測試經驗接近。

今次測試中,Duplex會在對話一開始明言自己是Google的預約服務,並會錄下對話——這跟最初公開的示範錄音有明顯分別,相信Google是為了回應早前外界的質疑。

《Ars Technica》記者亞馬迪奧(Ron Amadeo)表示,他在測試時處理訂位的表現很差,但Duplex則不錯,它在他手忙腳亂的時候有耐性地等候,並會按要求重複對話內容。雖然起初Duplex希望預約的時間「沒有位置」,最終還是順利訂位。

Duplex遇到的挑戰

測試期間,不少人嘗試刁難Duplex。有「店員」在Duplex預約了四位後刻意說︰「好的,所以是晚上八點六位?」Duplex立即更正︰「我需要預約四位。」另一人嘗試把Duplex當成Google助理詢問天氣,它回應︰「我只可以預約留位,我希望可以訂四位…」Google方面表示,如果餐廳已經關門,Duplex會在營業時再打來。

亞馬迪奧提到,Duplex只能提供獲授權分享的訊息,在其中一次測試中,當對方問題來電者的電郵時,Duplex回應說︰「恐怕我無權分享客戶的電郵」。他認為Duplex最奇怪並令人留下深刻印象的一點,是它沒有單一的「Duplex聲音」,每次通電話都有一把新聲音。但它似乎不會確認餐廳名字,即使「店員」隨意說錯店名,它仍不會理會,似乎只靠Google地圖提供正確資訊。

在另一場測試中,《Recode》記者華格拿(Kurt Wagner)觀察了幾次對話後嘗試為難Duplex,最終Duplex交由人類處理。Duplex的產品經理拉格(Valerie Nygaard)強調,這個系統有人類支援,當Duplex無法完成對話時會接手,亦會標註對話讓演算法學習。負責Google助理的副主席哈夫曼(Scott Huffman)表示,現時Duplex打出的電話有五分之四毋須工作人員協助。

AP_18177750928139
Photo Credit: Marcio Jose Sanchez / AP Photo / 達志影像
拉格親身示範跟Duplex對話。

《TechRadar》記者史偉達(Matt Swider)亦意圖挑戰Duplex,先詢問預約者的名字,得到回答「George」後再問其姓氏的第一個字母,Duplex只能回覆「那是Hill」,未能準確說出答案「H」。

仍在早期發展階段

負責Google助理產品及設計的Google副主席霍斯(Nick Fox)表示,他們將會在未來數星期內開始作有限度測試,但只有「獲信任的用戶」可以測試這項功能,亦僅限於有跟Google合作的商戶。

Google計劃推出三項服務,首先是查詢營業時間,然後是餐廳訂位和預約剪髮——Google只訓練了Duplex處理這三個領域的對話。目前Duplex無法處理其他對話,亞馬迪奧解釋其中一個原因是Google受法律所限,無法截取大量電話對話,因此須自行生產數據來訓練人工智能,收窄範圍較容易成功。哈夫曼亦承認他們選擇了特定任務來訓練Duplex,使它只能在狹窄範圍內表現出色,並非通用人工智能——也未能通過圖靈測試。

AP_18177751243897
Photo Credit: Marcio Jose Sanchez / AP Photo / 達志影像
其中一個測試現場,圖中站立者為哈夫曼。

至於甚麼時候可以讓大眾使用這項服務?哈夫曼坦言︰「我們也不太清楚。」霍斯也表示,技術尚在非常早期的階段,今次介紹Duplex的時間比平時介紹其他產品為早,而這是為了獲得回饋。他解釋這不單是非常新的技術,也是嶄新概念,所以他們不僅要技術上正確,也要把握好其他產品元素,包括披露資訊、業務合作、使用經驗等,而他們不會幻想在自己的辦公室、會議室內便能得到所有答案。

資料來源︰

資料來源︰