看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 1014/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: "Heaven" <heaven@novell.zcom.com.tw>, 信區: BudaTech
標  題: Re: 丹青OCR“學習字庫功能”使用心得報告]
發信站: (NEWS/INFO) National Sun Yat-San University (Thu Oct 16 12:16:08 1997)
轉信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail
來  源: buddha.nsysu.edu.tw


> > ★★到底可以建立多少學習字?待考。
> 這下子好像『考』出來了→最好不要超過 330個字。
> 今天一開機玩丹青 OCR,奇怪!只要有掛上 T6142學習字,系統每次都當得
> 死死的。本還搞不清楚怎麼回事,直到換另一台電腦再試,我才確定是學習
> 字檔 train.dbs 長度過大所致。
> .......略.....
> 有 339字,我懷疑這樣多的學習字數會造成系統嚴重當機。所以建議有使用
> 丹青 OCR的各位,請隨時留意您的 train.dbs  長度,大概超過 330字,也
> 就是長度超過  74314 bytes 時,就該適可而止了。若再增加下去,下場可
> 能很慘,整個學習字庫得重零開始建立。還好,我在 22122 bytes(97字)
> 時做過一次備份,現在正可以利用這個備份檔重新建立。

這是某光碟的目錄說明 : 供參考

UMAXOCR2      <DIR>  UMAX 丹青中文辨識系統 V2.0 專業版。

                     □ 辨識速度486 DX2-66上約 23字/秒
                     □ 多頁批次處理處理(最多200頁)
                     □ 可辨識字庫:繁體13202字、簡體6763字
                     □ 可學習1024個新字
   		                  ^^^^
                     □ 以6萬詞之詞庫自動校對

  Heaven

閱讀文章: 第 1014/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org