台灣開發的語音轉文字App:「雅婷逐字稿」試用想法與比較

台灣開發的語音轉文字App:「雅婷逐字稿」試用想法與比較
圖片來源:作者提供
我們想讓你知道的是

「雅婷逐字稿」距離真的讓人驚豔的語音辨識工具有些距離,也沒有達到它所訴求的中英文夾雜都能辨識的要求,並且也缺乏像是標點符號自動辨識(甚至自動插入)這樣的好用功能。不過,「雅婷逐字稿」確實具有堪用的中文辨識能力。

唸給你聽
powered by Cyberon

這確實是一個讓人躍躍欲試的消息──這兩天新聞紛紛報導,台灣專注人工智慧的開發團隊AILabs,推出了一款中文語音辨識App:「雅婷逐字稿」,在Android與iOS免費上架,提供使用者語音轉文字的辨識功能。

追蹤電腦玩物的朋友可能在這一年來,常常看我提到「語音輸出筆記」的相關經驗談。一方面我本來工作上就常常採訪與開會,語音筆記對我來說有實用性(如:實戰採訪與會議筆記:Evernote錄音筆記最佳化心得)。另一方面當可以在電腦前打字的時間愈來愈少,語音寫作成為我一個累積想法的有效率作法(經驗總結在:用語音寫筆記實戰經驗分享:寫文章、日記、點子的不同作法)。

也因此,我試過許許多多的語音轉文字App,不乏支援中文的選擇,所以當看到台灣團隊自主研發中文語音辨識功能,我也馬上安裝,比較看看,也試試看能否應用到自己的工作流程中。

你也可以立刻安裝「雅婷逐字稿」的Android版iOS版來試試看。

以我實際測試一天多後的心得總結,「雅婷逐字稿」距離真的讓人驚豔的語音辨識工具有些距離,也沒有達到它所訴求的中英文夾雜都能辨識的要求,並且也缺乏像是標點符號自動辨識(甚至自動插入)這樣的好用功能。

不過,「雅婷逐字稿」確實具有堪用的中文辨識能力。如果從它是台灣團隊開發的中文語音辨識功能,可能會針對台灣口語在地化,或是像它訴求的「你無需有資料被傳出台灣的隱私和資安疑慮」。那麼這樣的起步,確實有讓我會繼續期許它變得更好的信心。

下圖是我讀自己最近一篇文章:「工作愈忙愈要降低決策疲勞,6個方法避免選擇癱瘓」,看看「雅婷逐字稿」的轉換效果。

可以看到,在Android版中,「雅婷逐字稿」會自動把每一句分段,雖然無法自動輸入標點符號,但這樣分段,讓未來整理逐字稿時,也還是比文字混在一起易讀。

在辨識上,雖然不是最準確的辨識工具,但整篇來說,還是轉換成一篇看得懂大概意思的逐字稿。

而「雅婷逐字稿」工作時,除了把語音轉換成文字稿,也會同時錄下錄音檔。於是當真的要回顧整理之前的採訪、會議時,可以聽聽錄音檔,或是直接編輯文字稿,雙管齊下,其實符合真實工作需求。

接下來,我會舉一些自己使用過的語音工具,來嘗試看看「雅婷逐字稿」有可能往哪個方向變得更好。

1
圖片來源:作者提供

我之前嘗試過一個工具:「Wrappup聰明手機錄音App:免費語音轉中文與自動聽寫筆記」,雖然它後來在新版中,不再支援中文語音轉換,但這個工具的設計,卻可能是我目前最喜歡的「採訪、開會錄音工具」。

Wrappup開始後,可以隨時記錄會議中「重要的一段」,不只把這段話錄音下來,而且同時可以轉成文字記錄。一場採訪與開會後,我就可以獲得這次會議中許多段重要錄音與逐字稿。回到辦公室,邊聽邊剪貼、修改,節省不少時間。

而「雅婷逐字稿」的功能設計也具有這樣的方向,它目前最大的特色,就是「兼存錄音與逐字稿」,這樣的對照在工作上是真的實用的。而且「雅婷逐字稿」也能在每段逐字稿隨時中斷、繼續錄音,只錄重點,更符合採訪開會需求。

只是有沒有可能加上更多「逐字稿」需要的關鍵功能呢?例如重點段落註記等等。

3
圖片來源:作者提供

在中文語音辨識輸入上,很多朋友都會推薦「訊飛輸入法」,我自己也是這個工具的長期使用者。

其實它的語音辨識速度,可能沒有「Google語音輸入」那麼快、那麼準確(以我在台灣的使用情境來說),但是訊飛卻有一個真正讓我的語音筆記變得更有用的關鍵功能,就是可以「自動插入標點符號」。

這樣一來,語音辨識出來的文字稿,就是更加可讀的。

而且老實說,「訊飛輸入法」自動插入的標點符號也不是那麼準確,也常常出錯,但只要有基本的逗點、問號,讓語句可以分段,這樣事後整理真的就節省很多時間了。

而在語音轉文字的辨識準確度上,「雅婷逐字稿」除了號稱要針對台灣口音外,或許也可以在標點符號(或是更聰明的分段)下功夫,因為這是許多中文語音輸入會卡關的地方。(可參考:iPhone、訊飛中文語音輸入法比較,影片實測語音筆記效果

我不是人工智慧的專家,但我是語音轉文字筆記的長期使用者,雖然我的評價可能沒有技術性上的根據,但仍是身為使用者,長期使用覺得最關鍵的體驗。

我也很期待,「雅婷逐字稿」有一天可以成為我實際工作上的實用App,幫助我解決採訪、開會記錄難題,幫助我更快速語音筆記。期待它能愈來愈好,甚至能夠超越我這篇文章提到的:「10個免費語音轉文字工具,支援中文提升多種文書工作效率」,各式各樣的語音轉文字工具。

本文經電腦玩物授權刊登,原文刊載於此

責任編輯:朱家儀
核稿編輯:翁世航