看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 1361/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: Heavenchow@Lion (Heaven), 信區: BudaTech 標 題: Re: 有關經典電子化 發信站: 獅子吼站 (Sun Nov 1 23:39:15 1998) 轉信站: Lion ==> 於 (cricket@ksts.seed.net.tw,) 文中述及: >前一陣子諸位大德討論有關經典電子化, >因在下不懂,所以也沒有在意, >現想了解電子化中比較技術上的問題, >如 ... <略> >如果諸位大德有保留那時討論的 mail 可否forward >一份給我,或告訴我去那找. 在獅子吼站的 buda-tech 討論區, 有完整的保留, telnet://cbs.ntu.edu.tw [buda-tech 版] >1. 掃描解析度 據說一般 300 dpi 就很不錯了, 但若是古文或較不清楚 的資料, 則要較高的解析度, 例如我們處理大正藏, 就發覺 400 以上有更好的效果. >2. 辨認軟體名稱及正確率 之前後學測試時, 覺得丹青效果不錯. 我是用大正藏為樣本, 試用丹青, 電信研究所那一套及大陸清華那一套. (名字都忘了) 好像還有個叫新文通或什麼的, 但以丹青最為理想. (ps. 我只是粗略測試, 各軟體或許有最佳化的調整, 我都沒處理) >3.記得有去點程式的種種 有人寫過一支去點程式, 大概能粗略去除 大正藏, 佛教藏及續藏的雜點, 在東坡站上應該找得到. >4. 標點符號問題 什麼問題? OCR 辨識問題嗎? >5.文字直式轉橫式的問題. 純文字直式文字變橫式嗎? 之前後學有想過用漢書寫些巨集來處理, 但需求度不高就一直沒動手. 若有需要則歡迎來討論. 但因為許多經文都有橫式的了, 所以我都不管直式的那些. >6.其他 其他就歡迎來討論了. 其實這些問題在不同情況有不同的方法來處理, 很歡迎您以您目前要處理的現況與大家一起討論. 或許您要的東西都有現成的成品了, 就不用那麼麻煩了. heaven -- ██【北獅南鹿】██ 您在學佛路上有疑問嗎?-----BudaHelp 版,幫助您! 您對佛教神祕事件好奇嗎?---BudaXfile版,滿足您! 一片清涼的佛法討論園地,需要您的愛護與灌溉,歡迎您的光臨: 台大佛研中心獅子吼站:telnet://cbs.ntu.edu.tw (IP:140.112.143.30) [鹿苑]佛教暨慈青專站:telnet://buddha.nsysu.edu.tw (IP:140.117.11.90) Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.189.90] |
閱讀文章: 第 1361/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |