解開鍵盤的身世密碼(下):倉頡與注音輸入的文化史

解開鍵盤的身世密碼(下):倉頡與注音輸入的文化史
Photo Credit: othree @ Flickr CC BY 2.0

我們想讓你知道的是

技術物不只接受社會影響,它也影響社會。想想看,當實體鍵盤開始讓位給觸控面板時,注音輸入法還會穩穩站在右上角嗎?

解開鍵盤的身世密碼(上):QWERTY與大易輸入的社會史

文:郭文華(國立陽明大學科技與社會研究所副教授)

倉頡、個人電腦與漢字基因

轉到左下角,與大易字根相對的,是更早研發,也是中文輸入法的代名詞的倉頡字根。從電影《明日帝國》(Tomorrow Never Dies,1997)的一個場景,可看到它在西方世界的地位。

號稱在劍橋大學得到東方語文學位的007情報員龐德(James Bond),在越南的某情報站看到電腦,便跟華人情報員林慧(楊紫瓊飾演)說他要來負責聯絡。結果,看到所謂「全中文」鍵盤後龐德傻眼,央求林慧過來處理。

電影《明日帝國》中出現的全倉頡鍵盤。(作者翻攝該片DVD)

對台灣觀眾而言,這自然不是學過中文就可以上手的電腦介面。某種程度上,它可算得上是「台灣之光」或「華人之光」;在電影中它擠掉英文字母,獨自站上鍵盤中央,體現亞洲崛起,運籌世界的夢想。

但撇開民族情感不談,這個場景裡還有一個值得注意的地方-鍵盤的尺寸。不管怎樣複雜的電腦,鍵盤似乎愈做愈小,功能愈來愈強。但事實上,早在電腦發展初期,鍵盤的尺寸就沒太多改變。拿早期因應人口普查而開發的Univac電腦來說,雖然儀表板上功能鍵一大堆,硬體的粗笨就更不用說,但指令輸入的部份卻是類似電動打字機的標準鍵盤。

左圖為第一台商用電腦Univac(圖片來源:Computer History Museum);右圖則為交通大學的中文鍵盤(圖片來源:維基百科)

但這點卻在電腦引進台灣時造成問題。相對英文字母的線性組成,要讓電腦呈現中文,便得外加中文的鍵盤區。但是如果只是直接將打字排版的概念用在上面,不但輸入不便,而且從資料處理的角度看,因為中文是兩維(two dimensional)結構,如果每個字都分別存入,會佔掉不少記憶體空間,削弱電腦其它方面的功能。換句話說,中文鍵盤不但要將鍵數減少,更要對呈現的方式細細思量。

1973年國立交通大學研發的中文鍵盤,紀錄這個技術的突破。當時計算機工程學系的謝清俊教授與研究生劉錫麟以字根為基礎,建構中文輸入的第一個平台。

這個宣稱是「中型」的鍵盤長32鍵,寬20鍵,右邊的中文鍵入區有496鍵,每一個鍵代表一個字根。字根與字根透過「直連」(比方「肯」字是「止」與「月」兩個字根的直連)、「橫連」(比方「林」字是兩個「木」字根的橫連),與「包含」(比方說「周」是「ㄇ」字根裡包含「土」與「口」兩字根的直連)等關係,來直接「造出」中文字。

相較明快打字機的找字運作,這部中文電腦更徹底地拆解、擠壓與組合中文字,比方說怎樣分配字根的大小比例,印出來的字才不會頭重腳輕,左肥右瘦或腹大中空,看起來不像中文。不過,這個做法確實讓「電腦說中文」產生了曙光。據謝清俊表示,用這種方式可以拼出8532個字,記憶空間更減少到四十分之一。

標榜「倉頡造字他拆字」,倉頡輸入法發明人朱邦復以非學院背景,在1973年加入這場字根簡化的競賽。他之前在巴西一家大出版社工作,驚訝於當地對文化轉譯的迅速,也體會中文在這個資訊爆炸時代中不能落後。之後他回到台灣,用了5年時間摸索中文的「字母化」,推出「形意檢字法」。它也是倉頡輸入法的基礎。

這套字母跟英文一樣,只有「日月金木水火土,人心手足口耳目,王石山虫魚犬馬,衣言絲草竹」等26個字母,簡單是夠簡單,但卻無法達到「盲目按鍵」,即只要輸入字母,就可以準確鎖定某個特定中文字的希望。

這個問題一直到1978年才因為中文系出身的沈紅蓮加入,將中文字根據字義與造字原則(指事、會意、形聲)拆成「字首」(非部首)與「字身」,才有所突破。他們維持先前的「字母」概念(但內容與分類上都有調整),使用上將它們轉化成類似明快的字根,用它們來標定字首與字身。

有趣的是,朱邦復雖然堅持漢字要走自己的路,找出其造字原理,但他也堅持這些「字母」絕不能超過標準鍵盤可容納的數目(大易輸入法相較之下使用較多的字根)。對這個妥協他有一套邏輯:他認為這個輸入法要好用,就不能佔用標點鍵與數字鍵。

而因為電傳打字機沒有小寫字母,因此如果要讓它可以用在電傳打字機,也不能動到大小寫的功能,讓一個鍵可以打出兩個字碼。他的盤算是:「既然有英文文字鍵,而英文系統已經成為舉世通用的標準,所以中文必須與英文鍵共用,僅留一鍵供中英文的選擇」。

讓中文鍵盤臣服在QWERTY鍵盤規格的,是這個想法與宏碁的研發團隊。在1980年電子展中宏碁以一台微電腦加終端機與標準鍵盤的「天龍中文電腦」初試啼聲,而後倉頡輸入法隨著QWERTY鍵盤的全球化腳步,取得中文世界的領導權。

透過個人電腦的流行,它將原先早已取得技術優勢的大鍵盤找字人員完全淘汰,成為中文鍵盤的標準配備。甚至,在朱邦復宣布放棄倉頡輸入法的專利權後,市面上出現以它為基礎,但適應不同華文語境與使用者的輸入法,比方簡易/速成輸入法、新倉頡輸入法、快速倉頡輸入法等,更不用提其他以拼字為基礎的輸入法。

施振榮與朱邦復簽約合作開發中文電腦輸出入系統技術1980,引自《施振榮的電腦傳奇》。


猜你喜歡


【影音】整理數十萬張空拍影像,就像一場馬拉松:看見・齊柏林基金會「數位典藏」計畫

【影音】整理數十萬張空拍影像,就像一場馬拉松:看見・齊柏林基金會「數位典藏」計畫
Photo Credit:TNL Brand Studio

我們想讓你知道的是

「透過影像為環境發聲」是齊柏林畢生在做的事,也是看見・齊柏林基金會要接力做下去的事。打造一座把台灣存起來的影像資料庫,讓齊柏林留下的影像資產得以傳承世代,「數位典藏」計畫需要你我一同支持響應。

2017年,《看見台灣》的導演齊柏林匆匆離開這個世界,留下無數珍貴空拍影像資產;這些跨越1990年代到2017年、長達25年台灣自然與人文地景變遷的真實紀錄,不只保留了台灣之美,更在學術研究、環保倡議和環境教育上有著無可取代的價值。然而,龐大的影像素材需要經過「數位典藏」才能被有效應用,因此「看見・齊柏林基金會」成立的初衷,就是為了承接數位典藏的使命,讓齊導畢生的心血,能夠世代傳承,發揮永續的影響力。經過兩年的摸索,基金會最終研擬出最合適的數位典藏計畫,不只將齊導作品數位化、分類歸檔,更要建置線上影像資料庫,並將繼續記錄台灣的使命傳承下去。

根據看見・齊柏林基金會統計,齊柏林導演在空中拍攝超過2500小時所累積的影像,約為10萬張空拍底片、50萬張數位照片,上千小時的空拍影片;要為如此龐大的影像資料建檔與整理,勢必耗費許多金錢、時間與人力。不過,只要能集結眾人之力,這一場數位典藏人員及專業志工接力的馬拉松,將會是美麗而撼動人心的一段旅程。

「數位典藏」做什麼?

數位典藏(digital archive),意思是將有保存價值的實體或非實體資料,透過數位化(諸如攝影、掃描、影音拍攝、全文輸入等)與加上屬性資料等詮釋資料(Metadata),建立數位檔案的形式,作為永久保管儲存。

而看見・齊柏林基金會的數位典藏計畫可分為三大工作線,分別為:

  • 傳統底片組:挑選底片→掃描成數位檔案→建立屬性資料→歸檔
  • 數位照片組:挑選照片→建立屬性資料→歸檔
  • 空拍影片組:挑選影片→建立屬性資料→歸檔

除了要將齊導留下來的影像作品數位化歸檔,數位典藏計畫還包括改版建置「iTaiwan8影像資料庫」,也就是建設完整的線上影像資料庫系統,讓齊導作品更便於靈活運用,也能讓更多世人看見。

飛行2500小時累積的空拍影像,怎麼整理?

  • 整理底片/數位掃描

數位典藏組專員詹宇雯的工作,是負責整理傳統底片。即便存放在防潮櫃中,傳統底片仍面臨逐漸老化褪色的壓力,需要與時間賽跑進行數位化保存;然而大多未經篩選的10萬張底片,有些因為直升機震動導致些微的畫面模糊,也有因飛行路線連續較重複的地景構圖,而詹宇雯的其中一項任務,就是拿著放大鏡一一檢視精挑,並標註定位和勘誤照片資訊。

「整理底片最常發生的問題就是人工出錯,因為以前留下的資料可能是齊導或其他志工整理出來、用手寫的,貼紙可能貼錯或資料寫錯。」詹宇雯說起某次經驗,當時有一張台北車站的照片被貼了很多年份,為了找出正確年份,她試圖辨識照片裡招牌跑馬燈上的氣溫、股市市值等資料,交叉比對推斷出正確年份。雖然偶有這種偵探辦案一樣的趣事,但大多數時候是耗費專注度與眼力的過程。

完成底片挑選的階段,接著進到底片掃描數位化。然而,這步驟並不容易,除了整體的影像品質控制與檔案管理,齊柏林導演留下的底片最遠距今至少11年,老化褪色的底片容易出現色彩偏誤,須進行色彩還原,再修掉畫面上的髒點、存成解析度高的數位影像才算完成。

image3
Photo Credit:TNL Brand Studio
整理傳統底片的過程,必須拿著放大鏡一一檢視精挑,標註定位和勘誤照片資訊。
  • 建立屬性資料

所謂「建立屬性資料」,其實就是為影像添增各種描述紀錄的資訊,有了這些資訊,龐大的影像資料才能被有效率的搜尋、管理。數位典藏組副組長陳宣穎表示,以齊導拍攝的影像為例,包含:拍攝主題、地點及詮釋地景的關鍵字都屬於此範疇;而其中投入最多時間的便是「定位」和「建立關鍵字」這兩項任務。

「定位」指的是找出拍攝主體所在地點和座標,有時可透過既有的飛行軌跡紀錄來推測,但更多時候是在沒有軌跡紀錄的狀態下,憑藉地理知識及照片上的蛛絲馬跡判讀位置。如果影像拍攝年代久遠,或是地景變化很大,就需要運用更多歷史圖資或佐證資料去搜索、推論。

「我們要一張一張照片判讀,建立屬性資料。像是早期的傳統相機沒有定位功能,常常看到照片中只有一大片山稜線,此時我們就要仔細比對地圖、衛星影像,想辦法查找,盡可能貼近正確。」陳宣穎說。

「建立關鍵字」看起來似乎相對輕鬆,然而事實上,光是決定有哪些關鍵字可以使用,就是一門功夫。第一步必須辨認影像中的景物,例如一塊農田種植的是什麼作物,就必須蒐集其他資料輔助判斷;其次,由於空拍照片尺度不一,在畫面中佔比多大的景物需要設立關鍵字,也需要經過討論訂定規則;最後,還必須從使用者的角度思考,依據一般人的搜尋習慣設立關鍵字。

因此,在建立屬性資料的過程中,看見・齊柏林基金會也特別諮詢多位專家,共同研究規劃出適合台灣空中影像的關鍵字建置邏輯,並以此基礎進行分門別類、校正檢核,確保影像被妥善歸納及運用。

image2
Photo Credit:TNL Brand Studio
建立屬性資料時需要大量對比地圖,並依照訂定好的規則建立屬性資料,使歸納邏輯一致。
  • 影音資料典藏

相較於照片整理,動態影片的典藏工程更為多元複雜。首先,要針對近千小時空拍影片進行盤點,接著進行特殊格式轉檔與備份,再逐步建立邏輯編碼、標示檔案管理方式,以推動後續屬性資料建立。

「影片整理最大的兩個挑戰,其一是影片內容橫跨的範圍很大,導演可能是台中起飛、屏東降落,因此要去判斷每個影片節點的地景定位;其二是飛機上升的垂直範圍很大、晃動又劇烈,有時候會遇到『果凍效應1』致使內容失真。」影音製作組專員鄭宇程說明,由於各時期的影片拍帶檔案格式、影像內容品質、影片時長都不同,大大增加了管理建檔難度。

image4
Photo Credit:TNL Brand Studio
影音資料的典藏,需要讀取大量的檔案,逐格檢視、分段建立屬性資料、調色等。

加入數位典藏的馬拉松,傳承接棒台灣之美

從一步步定義操作流程、統一色彩管理語言、購置影像處理設備等,到培訓志工與實習生、讓人力支援一步到位、避免巨量資料的協作過程中出現錯誤,都是數位典藏計畫的範疇。多元內容創意部副總監王俐文表示,「數位典藏」四個字說來簡單,但過程繁複龐雜,需要所有人一致的專注、耐心、細心、以及熱忱。

「iTaiwan8影像資料庫」作為看見・齊柏林基金會數位典藏計畫的目標之一,改版上線只是第一步,接下來除了完成龐大影像資料的典藏,更大的挑戰是要繼續記錄台灣,讓影像不會只停留在2017年。

「透過影像為環境發聲」是齊導畢生在做的事,也是基金會要接力做下去的事。而數位典藏計畫,就是齊導生命的延續,也是基金會動力的源頭。要打造一座把台灣存起來的影像資料庫並不容易,看見・齊柏林基金會亟需各界的支持,共同建置屬於台灣最美的影像資料庫。讓我們一起守護齊柏林留下的影像資產,讓土地脈動的珍貴影像得以傳承世代,發揮更多價值。

捐款支持看見・齊柏林基金會,透過影像為環境發聲


註1:果凍效應(rolling shutter)是數位相機CMOS感光元件的一種效應,當使用電子快門來拍攝高速移動的物件時,原本垂直的物件拍攝出的畫面卻為傾斜甚至變形。(資料來源:維基百科)


猜你喜歡