看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 999/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: buda-tech7@buddha.nsysu.edu.tw, 信區: BudaTech
標  題: Re: 去雜點程式--大正藏版
發信站: (NEWS/INFO) National Sun Yat-San University (Tue Sep  9 18:54:04 1997)
轉信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail
來  源: buddha.nsysu.edu.tw

> 以FGFC比對A、C:只忽略一般的空白,有47個差異處。
> 以FGFC比對B、C:只忽略一般的空白,有31個差異處。

  這樣看來差異不多嘛! ... :p
  不過我相信若考慮由修改A->C 及 由B修改成 C 的時間應相差
  一倍以上.

> 又,私下懷疑,經過去符號後,多少會把一些原來正常的文字圖
> 檔削去一些。例如以下附件當中01B的「五『仃』阿雜漢」、03B
> .... skip ....
> 一來反而造成辨識錯誤。這些相關資料,我會在私下mail一份給
> heaven參考。

  這個問題我有發現, 原因是那些符號有些會和字相接著.
  若完全沒和字連在一起才算的話, 那些連在一起的符號就去不掉了.
  若只連一點點的也考慮去除, 就會不小心去除那些字的角落.
  目前看來不易取捨, 或許日後實務面才比較好判斷何者有利.

  Heaven

閱讀文章: 第 999/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org