解開鍵盤的身世密碼(下):倉頡與注音輸入的文化史

解開鍵盤的身世密碼(下):倉頡與注音輸入的文化史
Photo Credit: othree @ Flickr CC BY 2.0
我們想讓你知道的是

技術物不只接受社會影響,它也影響社會。想想看,當實體鍵盤開始讓位給觸控面板時,注音輸入法還會穩穩站在右上角嗎?

唸給你聽
powered by Cyberon
解開鍵盤的身世密碼(上):QWERTY與大易輸入的社會史

文:郭文華(國立陽明大學科技與社會研究所副教授)

倉頡、個人電腦與漢字基因

轉到左下角,與大易字根相對的,是更早研發,也是中文輸入法的代名詞的倉頡字根。從電影《明日帝國》(Tomorrow Never Dies,1997)的一個場景,可看到它在西方世界的地位。

號稱在劍橋大學得到東方語文學位的007情報員龐德(James Bond),在越南的某情報站看到電腦,便跟華人情報員林慧(楊紫瓊飾演)說他要來負責聯絡。結果,看到所謂「全中文」鍵盤後龐德傻眼,央求林慧過來處理。

電影《明日帝國》中出現的全倉頡鍵盤。(作者翻攝該片DVD)

對台灣觀眾而言,這自然不是學過中文就可以上手的電腦介面。某種程度上,它可算得上是「台灣之光」或「華人之光」;在電影中它擠掉英文字母,獨自站上鍵盤中央,體現亞洲崛起,運籌世界的夢想。

但撇開民族情感不談,這個場景裡還有一個值得注意的地方-鍵盤的尺寸。不管怎樣複雜的電腦,鍵盤似乎愈做愈小,功能愈來愈強。但事實上,早在電腦發展初期,鍵盤的尺寸就沒太多改變。拿早期因應人口普查而開發的Univac電腦來說,雖然儀表板上功能鍵一大堆,硬體的粗笨就更不用說,但指令輸入的部份卻是類似電動打字機的標準鍵盤。

左圖為第一台商用電腦Univac(圖片來源:Computer History Museum);右圖則為交通大學的中文鍵盤(圖片來源:維基百科)

但這點卻在電腦引進台灣時造成問題。相對英文字母的線性組成,要讓電腦呈現中文,便得外加中文的鍵盤區。但是如果只是直接將打字排版的概念用在上面,不但輸入不便,而且從資料處理的角度看,因為中文是兩維(two dimensional)結構,如果每個字都分別存入,會佔掉不少記憶體空間,削弱電腦其它方面的功能。換句話說,中文鍵盤不但要將鍵數減少,更要對呈現的方式細細思量。

1973年國立交通大學研發的中文鍵盤,紀錄這個技術的突破。當時計算機工程學系的謝清俊教授與研究生劉錫麟以字根為基礎,建構中文輸入的第一個平台。

這個宣稱是「中型」的鍵盤長32鍵,寬20鍵,右邊的中文鍵入區有496鍵,每一個鍵代表一個字根。字根與字根透過「直連」(比方「肯」字是「止」與「月」兩個字根的直連)、「橫連」(比方「林」字是兩個「木」字根的橫連),與「包含」(比方說「周」是「ㄇ」字根裡包含「土」與「口」兩字根的直連)等關係,來直接「造出」中文字。

相較明快打字機的找字運作,這部中文電腦更徹底地拆解、擠壓與組合中文字,比方說怎樣分配字根的大小比例,印出來的字才不會頭重腳輕,左肥右瘦或腹大中空,看起來不像中文。不過,這個做法確實讓「電腦說中文」產生了曙光。據謝清俊表示,用這種方式可以拼出8532個字,記憶空間更減少到四十分之一。

標榜「倉頡造字他拆字」,倉頡輸入法發明人朱邦復以非學院背景,在1973年加入這場字根簡化的競賽。他之前在巴西一家大出版社工作,驚訝於當地對文化轉譯的迅速,也體會中文在這個資訊爆炸時代中不能落後。之後他回到台灣,用了5年時間摸索中文的「字母化」,推出「形意檢字法」。它也是倉頡輸入法的基礎。

這套字母跟英文一樣,只有「日月金木水火土,人心手足口耳目,王石山虫魚犬馬,衣言絲草竹」等26個字母,簡單是夠簡單,但卻無法達到「盲目按鍵」,即只要輸入字母,就可以準確鎖定某個特定中文字的希望。

這個問題一直到1978年才因為中文系出身的沈紅蓮加入,將中文字根據字義與造字原則(指事、會意、形聲)拆成「字首」(非部首)與「字身」,才有所突破。他們維持先前的「字母」概念(但內容與分類上都有調整),使用上將它們轉化成類似明快的字根,用它們來標定字首與字身。

有趣的是,朱邦復雖然堅持漢字要走自己的路,找出其造字原理,但他也堅持這些「字母」絕不能超過標準鍵盤可容納的數目(大易輸入法相較之下使用較多的字根)。對這個妥協他有一套邏輯:他認為這個輸入法要好用,就不能佔用標點鍵與數字鍵。

而因為電傳打字機沒有小寫字母,因此如果要讓它可以用在電傳打字機,也不能動到大小寫的功能,讓一個鍵可以打出兩個字碼。他的盤算是:「既然有英文文字鍵,而英文系統已經成為舉世通用的標準,所以中文必須與英文鍵共用,僅留一鍵供中英文的選擇」。

讓中文鍵盤臣服在QWERTY鍵盤規格的,是這個想法與宏碁的研發團隊。在1980年電子展中宏碁以一台微電腦加終端機與標準鍵盤的「天龍中文電腦」初試啼聲,而後倉頡輸入法隨著QWERTY鍵盤的全球化腳步,取得中文世界的領導權。

透過個人電腦的流行,它將原先早已取得技術優勢的大鍵盤找字人員完全淘汰,成為中文鍵盤的標準配備。甚至,在朱邦復宣布放棄倉頡輸入法的專利權後,市面上出現以它為基礎,但適應不同華文語境與使用者的輸入法,比方簡易/速成輸入法、新倉頡輸入法、快速倉頡輸入法等,更不用提其他以拼字為基礎的輸入法。

施振榮與朱邦復簽約合作開發中文電腦輸出入系統技術1980,引自《施振榮的電腦傳奇》。

固然在倉頡創造之初朱邦復緊追主流,無暇思索倉頡字根如何好用活用,但他的夢想畢竟不僅止於創造一個輸入法,而是中文在資訊世界的定位。事實上,倉頡輸入法的優勢之一不僅是它可以輸入我們想得到的漢字,它還可以根據它的造字原理,為中文世界造出新字來。

這種類似韓國十五世紀的《訓民正音》,將原本為拼音的韓文,改造成可書寫可擴充的「韓文字」(諺文)的革命構想,讓他在電腦內碼的爭議遭人構陷後遠赴美國,更在1999年轉戰香港後提出「漢字基因」的概念,走自己的路。

這個想法簡單說是讓電腦像中文使用者一樣,利用中文處理資訊。先前發表的倉頡輸入法,只是這個基因工程中的「字碼」部份而已。按照朱邦復的說法,這個工程的規模已經遠遠超越讓電腦「說中文」或「懂中文」,而是更深層的,要怎樣讓電腦「用中文思考」。

當然,這個計畫目前為止公開的部份並不多,但從輸入法到電腦的全面思考,誰知道哪天電影《明日帝國》的場景不會實現,倉頡成為連接中文電腦的獨家輸入介面?

注音輸入法與語言學習

相較於大易與倉頡,電腦鍵右上角的注音符號大概是最「台灣」,也是我們從小到大最熟悉的符號。確實,這套在1912年由教育部制定,1918年公布,包含21個聲母(例如ㄅㄆㄇㄈ)、13個韻母(例如ㄢㄥㄤㄦ)、3個介母(ㄧㄨㄩ)符號的拼音系統,至今依然是台灣人學習中文最重要的工具。

用拼音來檢字不是新想法。十四世紀王禎的《農書》描述「以字就人,按韻取字」的活字製作與編排方式。活字按照聲韻分裝於木盤內,以五聲區隔;木盤則放在直徑約七尺,稱為「韻輪」的輪盤上,而「之乎者也」等虛字或數目等常用字則獨立成一門。要排版時工匠依照韻書,從各分韻中選擇印書要用的字。

由於在製作活字時工匠另行製作檢字手冊,按頁按行給每個活字編號,因此在尋找活字時不用知道字的寫法,也無須一字一字去尋找活字,只要根據聲韻唱出字號,坐在轉輪之間的檢字人便可按號索驥。

王禎《農書》中的排版過程。(圖片來源:中華印刷通史

不過在鍵盤與打字機發展的過程裡,注音符號卻一直缺席。對於用注音學中文的人來說,它似乎就是個學習的過渡,不算正式的書寫文字。以下例子說明這個尷尬狀況。

發明韓文打字機的公炳禹醫師(1907-1995)曾與發明中文打字機的林語堂會面,惺惺相惜。之後熱心的他主動製作以注音符號為鍵盤的「中文打字機」獻給蔣經國總統,認為它可以讓不識中文字者或盲人可以藉此與人溝通,甚至找到工作。想當然耳,這種「幼稚」的打字機並未得到重視,在總統府收下後便石沉大海。

在電腦研發的過程裡,注音也是較晚考慮的輸入方式,主要原因在於它無法鎖定輸入文字。對此,朱邦復說得很清楚:用注音輸入不是不可以,但且不管各地鄉音不同,發音不標準,光國語音只有1300個,文字卻有幾萬個,就知道說一個音重複率太高,需要其他資訊才能找到所需要的字。他的結論是:「如果注音可行,中文輸入早解決了,別人不是傻瓜,動腦筋的中國人可多的是!」

雖然如此,個人電腦開始普及,記憶體也大幅提升後,陪伴大家中文學習的注音輸入法,慢慢建立起自己的位置。事實上,東亞語文中原先就是拼音文字的日文與韓文,雖然在QWERTY鍵盤引進時曾有過字母配置的問題,但在第二次大戰後大多確定標準的鍵盤配置。相較起來,原先以拼字為中心的中文,一直沒發展出「拼音找字」的思考。這些都讓電腦時代的語音輸入產生不同的處理方式。

一個最明顯的考慮是鍵盤配置。我們最熟悉,也是繁體中文Windows內建的配置,是所謂的「大千式」。這個配置說穿了不稀奇,就是將我們過去學過的注音符號表(比方說放在小學生墊板後面那種)直接套在鍵盤上。不過,因為配合發音輸入的順序,因此聲母是放在左邊,往右才是介母與韻母。

標準鍵盤上的大千式配置。(圖片來源:維基百科)

與日文相同,注音符號也有不同的配置考量,甚至與英文結盟,開出新的輸入方式。比方說,為遷就熟悉英文鍵盤的使用者,最早開發中文輸入的倚天電腦,將注音符號與發音接近的英文字母放在一起(比方說「ㄆ」與「B」鍵)。之後更將中文輸入裡不會混淆的注音符號(比方說「ㄕ」與「ㄒ」)放在一起,將用鍵簡化到26鍵。

許聞廉發明的自然輸入法也是將英文與注音結合,但更強調聲母韻母的固有順序,與字型的接近(比方說「ㄚ」與「Y」鍵),而將用鍵更壓到25鍵。

在這個趨勢的另一端,則是全用英語的漢語拼音輸入法。雖然跟QWERTY鍵盤配置一樣,大多數人對習慣的輸入法會從一而終,但電腦時代才流行的注音輸入法,並未因為有微軟內建的加持而佔到便宜。不管是自然輸入法或倚天鍵盤都有固定的支持者,多數中文輸入軟體也都會提供鍵盤轉換的功能,不會讓使用者因此「雞同鴨講」。

但電腦畢竟對中文的學習產生衝擊。一個觀察是有電腦後不需要動手寫字,加上用拼音找字,字的寫法就被慢慢忘記。這種說法固然沒有問題,但我們或許還要更深入思考英語與電腦都向下紮根的現在,注音輸入法的意義。這一代的幼兒固然沒有朱邦復指出的「鄉音」問題,但他們是否還需要注音來學中文,頗值得疑問。

一方面,電腦如果是無所不在的個人教師,那用英文鍵盤就可以教育幼兒中文字的寫法唸法,無需注音這組學習工具。但另一方面,拼音輸入的邏輯也會影響語言學習的感覺。

比方說,中文裡有些字有讀音與語音在特定詞彙中有所不同,像「否極泰來」的「否」就要唸成「ㄆㄧˇ」而不是「ㄈㄡˇ」。但是,注音輸入法中並沒有這樣的對應,因此需要一字一字鍵入,而這樣拼出來的詞彙唸法也就與標準讀音有所出入。這些雖然還沒有太多研究,但已經引起不少人「中文低落」的感嘆。

這再次說明技術物不只接受社會影響,它也影響社會。想想看,當實體鍵盤開始讓位給觸控面板時,注音輸入法還會穩穩站在右上角嗎?

四角之外:電話的簡訊鍵盤

提到平板電腦,我們不妨想想電腦之外其它鍵盤的可能性。下面的螢幕畫面有三種鍵盤。左邊的我們很熟悉,是QWERTY鍵盤,但中間與右邊的只有十幾個鍵,配置也很奇怪。是的,它們都是手機。而手機可以鍵入文字,與電腦結合,是新的現象。它鬆綁我們對「輸入」這個動作的想像,更鬆綁了承載鍵盤定義的想像。

由左至右分別為iPhone上的英文觸控鍵盤、日文觸控鍵盤以及某款手機上的鍵盤配置。(作者攝)

電話是有趣的例子。當貝爾(Alexander Graham Bell)在1870年代發明它時,電話的重點是通話而不是號碼盤——如果只有電話線的這一頭與那一頭,哪還需要撥號?

但隨著電話的商業化與電話網的建立,業者就要處理使用者之間的連線機制。在早期,這個部份是電話交換機(telephone exchange),以接線生的人工服務處理。即使這個工作慢慢由自動交換機(撥號)取代,但直到1960年代,在特定場合的通話(比方說長途電話或國際電話)還是需要人工協助。

另一方面,為了準確接通,每支電話,甚至是電話使用戶都有號碼識別。比方說一群人分享一線號碼為「123」的電話,那其中一個使用者的識別號碼可能是「123-J」。

這些都導致可撥式電話的出現。基本上,號碼盤的原理是透過特定的信號組合(比方說撥「1」號代表1秒鐘有1次信號),讓交換機可以因此找到相應的受話者。早期的號碼盤沒有字母,但後來因為電話用戶太多,有時需要字母才能識別(特別是在美國),而加上字母後,一些電話也比較好記。不同的國家有不同的文字/號碼組合,而號碼的編排順序也不見得一樣。

這個號碼與字母結合的識別系統在1960年代按鍵式電話出現後逐步淘汰轉盤,成為電話的標準介面。但此後直到1980年代傳呼機(俗稱「BB call」)與大哥大出現之前,基本上字母是號碼的附屬品。

在台灣傳呼機十分簡單,只是傳送來電要求或提供新聞(尤其是股市)資訊而已。但香港與日本都曾發展出用傳呼機遞送簡單訊息的文化。當時的輸入方式固然有由傳呼台傳達,但也有用戶以號碼顯示,約定俗成的「傳呼機文字」(如「01」代表「先生」,「520」代表「我愛你」等)。

左圖為1910年的電話廣告;右圖為一個紐西蘭的撥號電話,請注意號碼與常見者顛倒。(圖片來源:維基百科)

只是,當文字顯示或語言傳輸的傳呼機開始流行時,手機也逐步進軍一般市場,提供更多服務。某種程度來說,它的簡訊功能承接傳呼機,而號碼盤的文字符號也與號碼分庭抗禮。大家雖然同用電話線路,但你撥你的號,我傳我的碼。

那非西方語文如何與這個新鍵盤系統接軌?日文部分,如先前看到的手機,是列出五十音的聲母(あかさたなはまやらわ),再進去選字母。韓文是將子音與母音分開,按韓文字書寫方式(比方說是左右合併、上下合併,還是先左後右再下)輸入。但與漢字無關,多達37個的注音符號要怎樣塞進數字盤上,就得好好思量。

兩種常見的注音符號排法:左為橫排,右為直排。

一個常見排法是按照大家學習的順序,先聲母再韻母再介母放在數字鍵中,最後是聲調與標點符號。另一種排法是將大家學過的標點符號表直排到數字鍵上。但如同早期的中文電腦一樣,手機廠牌會想加強方便,為號碼鍵盤設計不同的輸入法。

相較注音配置的紛紛擾擾,中國最流行的「T9輸入法」(Texton9Keys)善用其拼音優勢,直接與英語鍵盤接軌。它標榜只用英文,輸入法會根據漢語語境與用字習慣,選最適合的字。當然,不耐煩「拇指神功」的使用者也有選擇。他們可以購買配備類似電腦鍵盤的手機,或者是像前面舉出的例子一樣,利用手寫板或虛擬鍵盤。

鍵盤雖小,但從它們的變化與整合可看出資訊科技物品發展的趨勢。過去的工作站與個人電腦各有其職,但現在卻因為作業系統的強化而日益接近。手機與個人電腦過去固然井水不犯河水,它們的延伸物個人數位助理(personal digital assistant)或掌上型電腦(palmtop computer)與智慧型手機卻幾乎毫無差異。

它們可打電話、上網、照相、聽音樂,而它們的鍵盤也愈來愈互通。更何況,在人人使用數位鍵盤的時代,客製化鍵盤或輸入法不是這樣困難。只要有「按鍵組合-中文字」的對照表,就可以創造出新的輸入法。

如果到了那一天,說鍵盤的「四角密碼」還有意義嗎?

從「我手寫我口」到「我口說我手」

而這一天已經不遠。2011年底蘋果推出新一代手機iPhone 4,其中最炫的功能大概是稱為「Siri」的人工智能助理軟體。廣告中它與使用者無所不答,從查天氣問交通,找餐廳約訂位,到一些私密性的話題,Siri給人的印象是——如果鍵盤是「我手寫我口」的介面,那Siri是否象徵「我口說我手」的時代到來?

Siri所使用的自然語言處理,如同這篇文章介紹的很多創新一樣,不是新科技。以中文來說,早在1982年台灣大學資訊工程系的李琳山便與語言學家合作,陸續開發「金聲」系列的中文辨識軟體,而這個技術也日臻成熟,廣泛應用在電話總機或客戶服務上。

但是語音辨識只是這類電子產品脫離鍵盤的第一步。要讓這些環繞在我們四周的產品超脫一個口令一個動作的格局,需要可以與使用者相互溝通對話的人工智慧系統。

在目前Siri使用者的回應裡,顯示它不止有所謂「答案庫」,儲備一些情境中需要的答案,也有一定的分析能力,將上千上萬無厘頭的問題,回推到這個答案庫裡,對答出有脈絡意義,不致於雞同鴨講的答案。這篇文章不是要破解Siri,但我們願意指出在「超鍵盤」的世界裡,人與機器互動的新趨勢。

2007年MSN的鍵盤廣告。

幾年前微軟推出上面的MSN廣告,訴求網路的無限商機。它的廣告詞寫著:「101,這是標準鍵盤的數字。一開始,它們不用過來打字。現在,是用來敲開8,174,242個原本不相干的人生!……發明鍵盤的人一定沒想到,MSN出現後,鍵盤的功能變得這麼神奇」。

確實。不過短短數年,MSN已經被更多社交系統競爭甚至取代,這或許也是它的創辦者所沒有想到的,但鍵盤依舊在那裡,上面依然刻著愈來愈少人理解的身世密碼。它是二十世紀的羅塞塔石碑(Rosetta Stone),銘印著打字機時代到資訊年代裡人類社會與文明的秘密。

柑仔店的朋友們,讓我們向這個陪伴人類百年以上的技術物致敬!

(本文感謝洪朝貴教授與陳姃湲研究員的諮詢,特此申謝。)

延伸閱讀
  1. David Arnold, 2013, Machine and the Making of India’s Modernity. Chicago University Press.
  2. Paul David, 1985, “Clio and the Economics of QWERTY" American Economic Review, 75(2): 332-37.
  3. 郭文華,2008,標準鍵盤:在科技與社會中擺盪的人間尺度,科學月刊,39 (1),頁32-37。
  4. 邱大昕,2014,盲人與打字機,台灣STS學會通訊,2014年7月。
  5. Avital Ronell, 1991, The Telephone Book: Technology, Schizophrenia, Electric Speech. University of Nebraska Press.
  6. Thomas S. Mullaney, 2012, “The Moveable Typewriter: How Chinese Typists Developed Predictive Text during the Height of Maoism." Technology and Culture, 53(4): 777-814.

本文獲歷史學柑仔店(kám-á-tiàm)授權刊登,原文發表於此

責任編輯:翁世航
核稿編輯:楊士範