看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 752/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: maha <maha@tpts1.seed.net.tw>, 信區: BudaTech
標  題: Re: 電腦缺字表(274-07/09/97)
發信站: 國立中山大學網路組 Mailing List (Thu Jul 10 18:32:47 1997)
轉信站: Lion!ccnews.nsysu!news.nsysu!buda-tech@sccid.nsysu
來  源: sccid.nsysu.edu.tw

Heaven wrote:
> 
> >通用字,計算一下:166/235=71% ,也就是超過七成的佛典電腦缺字可以被「解決
> >」掉。
> 
>   請問目前在電子化的過程中, 是儘量用組合字保持原貌, 亦或用通用字取代?
>   通用字是比較方便也好讀, 以那些但求經意的人, 通用字就可達到目的了.
>   但了原貌故, 個人建議用組合字或圖檔. 畢竟將組合字轉成通用字很快,
>   要轉回原形就比較難了.

11/9/96寫過這麼一段話:

  針對大正藏第九冊的 216個缺字,我盡我微薄的能力查證其形、音、義及通用
  字。記得作業之初,我跟很多人一樣的想法,認為採用通用字就好,幹麼還管
  那些大家看不懂的字;但就有朋友跟我反應記錄原字形的重要。所以我最後的
  折衷方式是,先弄一個代碼版,把 216個缺字皆以代碼表示;然後再轉換為通
  用版(有通用字的用通用字,沒通用字的以組合字表示)以及造字版。

誠如所言「組合字轉成通用字很快」,而通用字要轉回原形就比較難了。因為一
個通用字除了它本身以外,還可能會對應到一個以上的缺字。

以現在來看這個問題,如果是較具規模的作業,我會慎重建議採取以上所言,重
點是要保留住往後可以有還原的機會。況且未來要是中推會的大 BIG-5出來,一
些原本我們以為需要造的字到時候極可能已被納入系統兩萬字裡面,那就麻煩了。

理想上是這樣沒錯,不過要照顧的事情多了一些。如果只是平常整理,使用通用
字可能對一般人會比較方便。請容許我偷懶,目前我也算是「一般人」,我的處
理原則是「有通用字的用通用字,沒通用字的以組合字表示」。

                                                          maha 7/10/97


閱讀文章: 第 752/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org