==> 於 (cricket@ksts.seed.net.tw,) 文中述及:
>前一陣子諸位大德討論有關經典電子化,
>因在下不懂,所以也沒有在意,
>現想了解電子化中比較技術上的問題,
>如 ... <略>
>如果諸位大德有保留那時討論的 mail 可否forward
>一份給我,或告訴我去那找.
在獅子吼站的 buda-tech 討論區, 有完整的保留,
telnet://cbs.ntu.edu.tw [buda-tech 版]
>1. 掃描解析度
據說一般 300 dpi 就很不錯了, 但若是古文或較不清楚
的資料, 則要較高的解析度, 例如我們處理大正藏,
就發覺 400 以上有更好的效果.
>2. 辨認軟體名稱及正確率
之前後學測試時, 覺得丹青效果不錯.
我是用大正藏為樣本, 試用丹青,
電信研究所那一套及大陸清華那一套. (名字都忘了)
好像還有個叫新文通或什麼的, 但以丹青最為理想.
(ps. 我只是粗略測試, 各軟體或許有最佳化的調整, 我都沒處理)
>3.記得有去點程式的種種
有人寫過一支去點程式, 大概能粗略去除
大正藏, 佛教藏及續藏的雜點, 在東坡站上應該找得到.
>4. 標點符號問題
什麼問題? OCR 辨識問題嗎?
>5.文字直式轉橫式的問題.
純文字直式文字變橫式嗎?
之前後學有想過用漢書寫些巨集來處理,
但需求度不高就一直沒動手.
若有需要則歡迎來討論.
但因為許多經文都有橫式的了, 所以我都不管直式的那些.
>6.其他
其他就歡迎來討論了.
其實這些問題在不同情況有不同的方法來處理,
很歡迎您以您目前要處理的現況與大家一起討論.
或許您要的東西都有現成的成品了, 就不用那麼麻煩了.
heaven
--
██【北獅南鹿】██
您在學佛路上有疑問嗎?-----BudaHelp 版,幫助您!
您對佛教神祕事件好奇嗎?---BudaXfile版,滿足您!
一片清涼的佛法討論園地,需要您的愛護與灌溉,歡迎您的光臨:
台大佛研中心獅子吼站:telnet://cbs.ntu.edu.tw (IP:140.112.143.30)
[鹿苑]佛教暨慈青專站:telnet://buddha.nsysu.edu.tw (IP:140.117.11.90)
Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.189.90]