日本的電視台連即時新聞及體育轉播都有字幕,怎麼做到的?

日本的電視台連即時新聞及體育轉播都有字幕,怎麼做到的?
Photo Credit: Reuters/達志影像

我們想讓你知道的是

儘管製作即時字幕非常不容易,不過日本的電視台還是很努力地提高節目的字幕普及率。當然,製作即時字幕時,最努力的是那些打字人員。這些人在工作之前要花很多時間預習,理解節目中可能會用到的專業術語和人名。

日本在2011年7月,岩手、宮城、福島三縣以外的所有地區的電視訊號全面數位化。
(※岩手、宮城、福島三縣由於在東日本大震災嚴重受災,所以全面數位化延後到2012年3月底)

日本的電視在數位化之後,民眾只要按一下電視搖控器上的「字幕」按鈕,就可以體驗到以前沒有體驗過的「電視語音字幕」。

日本電視節目的語音字幕除了可以設定成隱藏或顯示以外,還有很多特別的地方。例如字幕的位置不限於電視畫面下方。如果節目本身有用到補充說明用字幕或效果字幕,語音字幕會避開這些位置,這樣才不會妨礙觀眾觀看補充說明或特殊效果用的字幕。

另外,有些節目會用不同顏色的文字來區分不同的人的台詞。例如電視劇的對話場面中,A的台詞可能會用水藍色字幕,B的台詞可能用黃色字幕。這樣子,就算畫面沒有拍到說話的人,聽障人士還是可以從字幕顏色來分辨誰在說話。另外,如果電視畫面上同時出現兩個說話的人時,字幕可能會分成左右兩區,左邊的字幕顯示左邊的人的台詞,右邊的字幕則是右邊的人的台詞。

日本雖然在1980年代就開始提供字幕訊號,不過字幕不是說有就有的東西。字幕必須由人工來製作。由於當初大部分的節目製作單位沒有製作字幕,所以就算電視台能發射字幕訊號,實質上大部分的電視節目還是沒有字幕。

1997年,日本政府要求各家電視台在十年之內讓字幕普及化,並修法幫業者排除程序上的不便,所以日本提供字幕的電視節目越來越多。十年過後,NHK的字幕提供率完全達成目標。不過其他民間電視台的字幕提供率則在85%左右,並沒有達成日本政府設定的目標。

民間電視台沒有達成目標,是不是會受罰呢?

雖然電視台的執照是政府發的,不過日本的放送法規定,公權力必須保障廣電業者的表現自由。由於字幕的運用涉及表達手法,所以政府沒有立場強制業者在節目中加字幕。1997年日本政府設定的100%的目標,是希望電視台能朝這個目標努力,照顧弱勢的聽障族群。電視台開始在節目中加字幕,其實也是基於照顧弱勢、提升企業形象的考量。

由於製作字幕真的不容易,所以當時日本政府就規定,新聞和體育轉播等即時節目可以不用加字幕,歌唱、音樂演奏節目也可以不加字幕。至於外語節目由於一般製作字幕的人員也聽不懂,所以可以不加字幕。電視台在重播很早以前的舊節目時也可以不加字幕。

雖然NHK的字幕提供率在2007年達成目標,不過並不是所有的節目都有字幕。因為日本政府規定的目標是限於特定時段內的可以加字幕的節目。NHK達成目標時,早上七點以前、晚上十二點以後的節目未必有字幕。新聞、體育等節目也未必有字幕。

到了2008年,日本政府又為電視台設了新目標,希望所有的電視台能在現場即時節目、音樂節目、重播的舊節目中也加入字幕,而且希望所有的電視台在2017年時都能達到100%字幕提供率。這個結果就是現在日本大部分的節目都有提供字幕服務。

近幾年,有些到日本旅遊的人在旅館看電視時,如果有心去玩一下數位電視的字幕功能的話,會發現日本連新聞及體育轉播都有字幕。

有些人看到新聞和體育轉播的字幕時,可能會以為現在世界上已經有可以即時辨識語音的字幕系統。其實完全不是那麼一回事。字幕不是說有就有的東西,字幕必須由人工來製作。現在日本所有的新聞節目、體育節目的即時字幕全部是人力打字打出來的。

那麼不能用電腦自動辨識嗎?

電腦語音辨識輸入系統其實在1990年代就已經成為大眾商品,不過這種東西就和翻譯軟體一樣,非常不精確。這種系統只能當作在特定情況下加快人力作業的輔助工具。

語音辨識系統辨識得最漂亮的就是推銷這種系統的業務員的樣本台詞,因為業務員會一直用固定的幾句話來訓練系統。然而現實中目前電腦語音辨識系統再怎麼努力,正確率頂多只能到八成左右,偶爾運氣好的時候有機會辨識到九成。八成到九成,看起來很高,不過電視字幕的基本要求是零錯誤。如果電視字幕中,平均有兩成左右的內容是錯誤資訊的話,在台灣可能沒什麼關係,但是在日本就是嚴重的媒體醜聞,會要了電視台的命。

另一個問題是語音辨識系統只會辨識語音,無法辨識非語音的部分。我們在使用文字符號表達事情時,其實會用到很多和聲音無關的要素,這些要素就是「標點符號」。儘管電腦能辨識八到九成的語音,但是這種技術只能對聲波進行物理學上的轉換,系統本身無法理解聲波背後的人文意義,所以語音轉換出來的結果是完全沒有標點符號的連續文字串。而且這種連續文字串大約每五個字當中就有一字個是錯的。

目前日本的電視台在製作字幕時,的確會用到電腦語音辨識系統,不過只是實驗性質而已。製作方式是先讓電腦辨識語音,製作成字幕草稿後,再由人工修正錯誤,然後把這些沒有標點符號的文字串加上標點符號。這樣子可以讓工作人員少打幾個字,但是卻要修很多錯字,而且還要加很多標點符號。結果目前電腦語音辨識只用於輔助工作人員製作事前錄製的節目的字幕而已。校正時,校正人員還是要看錄製畫面,聽電視上的原音,否則根本無從校對。由於語音辨識的科技就只能做到這樣而已,所以電視台其實不太敢談語音辨識的實驗結果,因為效率真的不怎麼樣。如果結果發表出來的話,提案者和決策者可能會丟飯碗。