看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 1000/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: wan@Lion (wan), 信區: BudaTech
標  題: Re: 去雜點程式--大正藏版
發信站: 獅子吼站 (Mon Sep 15 21:06:59 1997)
轉信站: Lion

==> 於  (buda-tech7@buddha.nsysu.edu.tw,) 文中述及:
: > 以FGFC比對A、C:只忽略一般的空白,有47個差異處。
: > 以FGFC比對B、C:只忽略一般的空白,有31個差異處。
:   這樣看來差異不多嘛! ... :p
:   不過我相信若考慮由修改A->C 及 由B修改成 C 的時間應相差
:   一倍以上.
: > 又,私下懷疑,經過去符號後,多少會把一些原來正常的文字圖
: > 檔削去一些。例如以下附件當中01B的「五『仃』阿雜漢」、03B
: > .... skip ....
: > 一來反而造成辨識錯誤。這些相關資料,我會在私下mail一份給
: > heaven參考。
:   這個問題我有發現, 原因是那些符號有些會和字相接著.
:   若完全沒和字連在一起才算的話, 那些連在一起的符號就去不掉了.
:   若只連一點點的也考慮去除, 就會不小心去除那些字的角落.
:   目前看來不易取捨, 或許日後實務面才比較好判斷何者有利.
:   Heaven

剪一張紙,然後把有字的部份割下來,蓋到要scan的部份上去,然後是字就出來
標點就不見了這樣不知到可不可以
--
Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.163.36]
閱讀文章: 第 1000/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org