看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 959/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: maha <maha@tpts1.seed.net.tw>, 信區: BudaTech 標 題: Re: 六部藏經的辨識效果初探 發信站: 國立中山大學網路組 Mailing List (Thu Aug 28 08:18:59 1997) 轉信站: Lion!ccnews.nsysu!news.nsysu!buda-tech@sccid.nsysu 來 源: sccid.nsysu.edu.tw Heaven wrote: > > 順便問一下, 以往在 ocr 校對好的粗稿加上標點, 會不會很麻煩, > 這個我沒有實務經驗. 有時我校對一頁佛教大藏經(從 ocr 至校對完) > 要十多分鐘, 不知加上標點要多久? 拿《梵網經》第14頁為例,執行去圈點程式處理後,這時候以 OCR進行作業 ,計時開始── 08:11。經過自動版面分割、辨識,然後加以人工線上校對 ,完成時的時間是── 08:23。前後用了『12分鐘』。接著我就急忙跑去補 習班教課,回到家時,時間是22:50。 隔天,也就是現在,將昨天校對好的那一頁粗稿加上圈點。我沒有原書,但 早已把未去圈點前的圖檔印好了,所以就一邊看著紙面,一邊盯著螢幕上的 文字檔,從 05:40 到 05:47 ,總共用了『 7分鐘』。 這一頁佛教大藏經的經文,含圈點共有799字。 799字/(12分鐘+7分鐘)=42字/分鐘──這是目前『辨識+校對+圈點』的作業速度。 7分鐘/(12分鐘+7分鐘)=37%──這是加圈點所耗用的時間比例。 以上粗略統計,供 Heaven 及各位朋友參考。近日事忙,若有問題沒有積極 回應,還請原諒。 maha 8/28/97 |
閱讀文章: 第 959/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |