看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 1361/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: Heavenchow@Lion (Heaven), 信區: BudaTech
標  題: Re: 有關經典電子化
發信站: 獅子吼站 (Sun Nov  1 23:39:15 1998)
轉信站: Lion

==> 於  (cricket@ksts.seed.net.tw,) 文中述及:
>前一陣子諸位大德討論有關經典電子化,
>因在下不懂,所以也沒有在意,
>現想了解電子化中比較技術上的問題,
>如 ... <略>
>如果諸位大德有保留那時討論的 mail 可否forward
>一份給我,或告訴我去那找.

在獅子吼站的 buda-tech 討論區, 有完整的保留, 
telnet://cbs.ntu.edu.tw  [buda-tech 版]

>1. 掃描解析度

據說一般 300 dpi 就很不錯了, 但若是古文或較不清楚
的資料, 則要較高的解析度, 例如我們處理大正藏, 
就發覺 400 以上有更好的效果.

>2. 辨認軟體名稱及正確率

之前後學測試時, 覺得丹青效果不錯.
我是用大正藏為樣本, 試用丹青, 
電信研究所那一套及大陸清華那一套. (名字都忘了)
好像還有個叫新文通或什麼的, 但以丹青最為理想.
(ps. 我只是粗略測試, 各軟體或許有最佳化的調整, 我都沒處理)

>3.記得有去點程式的種種

有人寫過一支去點程式, 大概能粗略去除
大正藏, 佛教藏及續藏的雜點, 在東坡站上應該找得到.

>4. 標點符號問題

什麼問題? OCR 辨識問題嗎? 

>5.文字直式轉橫式的問題.

純文字直式文字變橫式嗎?
之前後學有想過用漢書寫些巨集來處理, 
但需求度不高就一直沒動手.
若有需要則歡迎來討論.
但因為許多經文都有橫式的了, 所以我都不管直式的那些.

>6.其他

其他就歡迎來討論了.

其實這些問題在不同情況有不同的方法來處理, 
很歡迎您以您目前要處理的現況與大家一起討論.
或許您要的東西都有現成的成品了, 就不用那麼麻煩了.

  heaven
--
【北獅南鹿】
您在學佛路上有疑問嗎?-----BudaHelp 版,幫助您!
您對佛教神祕事件好奇嗎?---BudaXfile版,滿足您!
一片清涼的佛法討論園地,需要您的愛護與灌溉,歡迎您的光臨:
台大佛研中心獅子吼站:telnet://cbs.ntu.edu.tw       (IP:140.112.143.30)
[鹿苑]佛教暨慈青專站:telnet://buddha.nsysu.edu.tw  (IP:140.117.11.90)
Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.189.90]
閱讀文章: 第 1361/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org