看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 999/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: buda-tech7@buddha.nsysu.edu.tw, 信區: BudaTech 標 題: Re: 去雜點程式--大正藏版 發信站: (NEWS/INFO) National Sun Yat-San University (Tue Sep 9 18:54:04 1997) 轉信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail 來 源: buddha.nsysu.edu.tw > 以FGFC比對A、C:只忽略一般的空白,有47個差異處。 > 以FGFC比對B、C:只忽略一般的空白,有31個差異處。 這樣看來差異不多嘛! ... :p 不過我相信若考慮由修改A->C 及 由B修改成 C 的時間應相差 一倍以上. > 又,私下懷疑,經過去符號後,多少會把一些原來正常的文字圖 > 檔削去一些。例如以下附件當中01B的「五『仃』阿雜漢」、03B > .... skip .... > 一來反而造成辨識錯誤。這些相關資料,我會在私下mail一份給 > heaven參考。 這個問題我有發現, 原因是那些符號有些會和字相接著. 若完全沒和字連在一起才算的話, 那些連在一起的符號就去不掉了. 若只連一點點的也考慮去除, 就會不小心去除那些字的角落. 目前看來不易取捨, 或許日後實務面才比較好判斷何者有利. Heaven |
閱讀文章: 第 999/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |