看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 959/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: maha <maha@tpts1.seed.net.tw>, 信區: BudaTech
標  題: Re: 六部藏經的辨識效果初探
發信站: 國立中山大學網路組 Mailing List (Thu Aug 28 08:18:59 1997)
轉信站: Lion!ccnews.nsysu!news.nsysu!buda-tech@sccid.nsysu
來  源: sccid.nsysu.edu.tw

Heaven wrote:
> 
>   順便問一下, 以往在 ocr 校對好的粗稿加上標點, 會不會很麻煩,
>   這個我沒有實務經驗. 有時我校對一頁佛教大藏經(從 ocr 至校對完)
>   要十多分鐘, 不知加上標點要多久?

拿《梵網經》第14頁為例,執行去圈點程式處理後,這時候以 OCR進行作業
,計時開始── 08:11。經過自動版面分割、辨識,然後加以人工線上校對
,完成時的時間是── 08:23。前後用了『12分鐘』。接著我就急忙跑去補
習班教課,回到家時,時間是22:50。

隔天,也就是現在,將昨天校對好的那一頁粗稿加上圈點。我沒有原書,但
早已把未去圈點前的圖檔印好了,所以就一邊看著紙面,一邊盯著螢幕上的
文字檔,從 05:40 到 05:47 ,總共用了『 7分鐘』。

這一頁佛教大藏經的經文,含圈點共有799字。
799字/(12分鐘+7分鐘)=42字/分鐘──這是目前『辨識+校對+圈點』的作業速度。
7分鐘/(12分鐘+7分鐘)=37%──這是加圈點所耗用的時間比例。

以上粗略統計,供 Heaven 及各位朋友參考。近日事忙,若有問題沒有積極
回應,還請原諒。

                                                      maha 8/28/97


閱讀文章: 第 959/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org