為什麼要用 Unicode


資訊更新日期: 10.22, 佛曆 (BE) 2557; 西元 2014 CE)


 

 文字的編碼是非常基礎的,在沒有Unicode的年代,除了英文之外,其他的語言都要使用特殊的字符編碼,比方說臺灣正體用Big5、中國簡化字用GB、日文用JIS、藏文、梵文等都有自己獨特的編碼方式。

  種不同的編碼,造成資料無法整合。即使勉強放在一起,也會造成處理和查詢上很大的麻煩。而佛學的資料,先天都有多語言的特質,一篇用中文寫的佛學論文,同時用到梵文、日文的機會很高。解決方案就是使用Unicode,以及搭配相應的字形檔,並且一開始就使用Unicode。如果已經用了其他的編碼,那麼轉換到Unicode的工作越早進行越好。如果到了資訊化的後期才進行轉換作業,就不是「另存新檔」那麼簡單,要面對的是應用程式和整套工具的汰換,以及根深柢固的使用習慣,轉換成本將會非常高昂。

  至今日,大部分的軟體工具已經完成Unicode化,除了早期開發的應用程式外,目前最常見的「非Unicode」應用,就是像Dia, Foreign1, kh2等的字形檔。所以,為了您資料的「前途」著想,請儘早改用Unicode。

  取材自:【Accelon,一個開放的數位古籍平台】,葉健欣 剎那搜尋工坊軟體工程師,佛教圖書館館刊 第四十七期 97年6月(2008 CE)


  • 將舊有以不同字型(例如 foreign1, Kh2 或 VriRomanPali CN, Times_CSX+)羅馬化轉寫巴利語之檔案,藉由 ms Word 巨集換為 Unicode字型

  • Unicode(中文:萬國碼、國際碼、統一碼、單一碼)(維基百科,自由的百科全書)
    Unicode備受認可,並廣泛地應用於電腦軟體的國際化與在地化過程。有很多新科技,如可延伸標示語言、Java程式語言以及現代的作業系統,都採用Unicode編碼。

  • 回到府城佛教網 歡迎指教!