看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 1189/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: maha <maha@tpts1.seed.net.tw>, 信區: BudaTech
標  題: 好東西來囉!
發信站: (NEWS/INFO) National Sun Yat-San University (Thu Feb 26 18:29:49 1998)
轉信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail
來  源: buddha.nsysu.edu.tw

以下六封信,Quiz、Heaven、Maha、Tone──這四人到底是在說些什麼「好
糠的東西」呢?

******************************************************************

Subject: 好東西來囉!
   Date: Mon, 22 Dec 1997 18:37:16 +0800
   From: "Heaven" <heaven@novell.zcom.com.tw>

各位:

承 quiz 兄幫忙, 不但寫了個 bmp -> tif 的批次處理程式,
還將去點程式也給漂亮化了. 呵! 呵! 很漂亮喔!

之前有些小問題, 看來都解決了. 這二天我會再大概試看看.
本想試好再公布, 但人多比較容易捉到問題, 故先給各位玩看看.
有問題再通知我, 若沒大問題, 我就在 buda-tech 公佈並放上
ftp server 了.

他並且還有其它計畫喔! 如下, 大家四目以待了. ("四" 忘了怎麼寫了 :p)

heaven

======================

我的程式,目前正加上一頁〔文字校對〕的功能,已經快好了,
好了後我會先將程式寄給您。試用看看,若有問題,先由我這邊
將他改到堪用後,就整個PROJECT移給您。

這個〔文字校對〕的功能包含跨檔案的文字尋找,置換,看圖,
檔案相加,所以您那邊假如有需要,可以繼續發展成大藏經的
檔案管理。乃至簡單的讀經,檢索功能。

呵...別嚇到了,移轉給您後,我還是STAND BY YOUR SIDE.

大家加油囉。

Have a nice day.

Quiz...

******************************************************************

Subject: Re: 好東西來囉!
   Date: Tue, 23 Dec 1997 02:18:32 +0800
   From: maha <maha@tpts1.seed.net.tw>

Heaven wrote:
> 
> 承 quiz 兄幫忙, 不但寫了個 bmp -> tif 的批次處理程式,
> 還將去點程式也給漂亮化了. 呵! 呵! 很漂亮喔!

的確很漂亮喔!不管外觀或操作性都不錯。

在設計上,如要玩去點遊戲,目前只接受G4格式的 tif檔,一般格式的
tif 檔還無法接受,這個是可以再想想的。因為我們一般利用掃瞄軟體
所掃瞄出來的皆只是一般格式的 tif檔,沒道理還要將它轉成 bmp檔,
然後再又轉成 G4 tif ,繞個大圈才能處理去點。

我的意思是說,在去點方面,看能不能設計成能夠接受一般 tif檔及G4
格式 tif檔;那個需要繞圈的部份,由程式在暗地裡解決就好了。

Quiz wrote:
> 
>         我的程式,目前正加上一頁〔文字校對〕的功能,已經快好了,
> 好了後我會先將程式寄給您。試用看看,若有問題,先由我這邊
> 將他改到堪用後,就整個PROJECT移給您。
> 
> 這個〔文字校對〕的功能包含跨檔案的文字尋找,置換,看圖,
> 檔案相加,所以您那邊假如有需要,可以繼續發展成大藏經的
> 檔案管理。乃至簡單的讀經,檢索功能。

看來,越來越好玩了,這將是我們期待的整合性電子佛典工具程式吧!

******************************************************************

Subject: Re: 好東西來囉!
   Date: Fri, 26 Dec 1997 13:22:50 +0800
   From: "K.Y.T." <tone@tpts1.seed.net.tw>

Heaven wrote:
> 
> 承 quiz 兄幫忙, 不但寫了個 bmp -> tif 的批次處理程式,
> 還將去點程式也給漂亮化了. 呵! 呵! 很漂亮喔!
> 
> 之前有些小問題, 看來都解決了. 這二天我會再大概試看看.
> 本想試好再公布, 但人多比較容易捉到問題, 故先給各位玩看看.
> 有問題再通知我, 若沒大問題, 我就在 buda-tech 公佈並放上
> ftp server 了.

  我在 DOS 下的 Windows 3.1 執行,會看不到選單的 title 文字,
  所以一開始我還以為只有一個 bmp-->tif 功能,因為看不到另外
  一個去點程式的選單(我不知該如何說這個名詞,只好以選單稱之)。

  雖然看不到,但 mouse 依然可以盲選來運作。可能講的不是很
  清楚,請 quiz 兄在 DOS6.22 下執行 win31 就知道了。

  加油!

******************************************************************

Subject: Re: 好東西來囉!
   Date: Sat, 27 Dec 1997 18:30:59 +0800
   From: "QUIZ" <ycc18@tcts.seed.net.tw>

> 在設計上,如要玩去點遊戲,目前只接受G4格式的 tif檔,一般格式的
> tif 檔還無法接受,這個是可以再想想的。因為我們一般利用掃瞄軟體
> 所掃瞄出來的皆只是一般格式的 tif檔,沒道理還要將它轉成 bmp檔,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

這很奇怪。大部分掃描程式應該都有支援 TIF G4 。
我從您那邊收到的都是 G4 的格式。

> 然後再又轉成 G4 tif ,繞個大圈才能處理去點。

可能以前並沒有詳細規劃,或者經驗不夠。
 
> 我的意思是說,在去點方面,看能不能設計成能夠接受一般 tif檔及G4
> 格式 tif檔;那個需要繞圈的部份,由程式在暗地裡解決就好了。
> 

請問一下還有多少這類非G4的圖檔?

文件校對那一頁的功能,其實只是跨檔案找字串,置換,和檔案依照卷期合併。
看圖。這些而已。

程式已經好了。我今天先寄給HEAVEN看看。

我的構想是:

掃圖->去圈點->OCR->OCR中初校->文件校對中去除常見錯誤->合併。

這樣子從掃圖到文字檔的產生所需要的程式就可以齊備了。

在
〔OCR中初校->文件校對中去除常見錯誤->合併成卷〕
這個過程,目前比較有問題。

因為掃圖的人員,他們作的非常好。這部分問題不大。就算要轉檔,那都是
電腦在累,人是很輕鬆的。

倒是校對和檔案合併...蠻頭大的。

新增〔文件校對〕的功能是想說這方面看能不能多少幫上一點忙。

Quiz...

******************************************************************

Subject: Re: 好東西來囉!
   Date: Sun, 28 Dec 1997 00:22:40 +0800
   From: maha <maha@tpts1.seed.net.tw>

QUIZ wrote:
> 
> > 在設計上,如要玩去點遊戲,目前只接受G4格式的 tif檔,一般格式的
> > tif 檔還無法接受,這個是可以再想想的。因為我們一般利用掃瞄軟體
> > 所掃瞄出來的皆只是一般格式的 tif檔,沒道理還要將它轉成 bmp檔,
> ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>
> 這很奇怪。大部分掃描程式應該都有支援 TIF G4 。
> 我從您那邊收到的都是 G4 的格式。

NO! NO! 大部份掃瞄程式都不支援 TIF G4。
您收到的 TIF檔,都是徐言輝在掃瞄成一般 TIF檔後再轉換成 TIF G4。
 
> > 然後再又轉成 G4 tif ,繞個大圈才能處理去點。
> 
> 可能以前並沒有詳細規劃,或者經驗不夠。
> 
> > 我的意思是說,在去點方面,看能不能設計成能夠接受一般 tif檔及G4
> > 格式 tif檔;那個需要繞圈的部份,由程式在暗地裡解決就好了。
> 
> 請問一下還有多少這類非G4的圖檔?

像黃郁婷目前針對30冊大正藏所掃瞄出來的圖檔,全都是一般的 TIF圖檔。
為了節省儲存資料空間,所以我們要將一般 TIF檔轉成 G4 格式。因此,我
們以後很有可能會同時遇上一般 TIF檔以及 G4格式 TIF檔。
 
> 文件校對那一頁的功能,其實只是跨檔案找字串,置換,和檔案依照卷期合併。
> 看圖。這些而已。
> 
> 程式已經好了。我今天先寄給HEAVEN看看。
> 
> 我的構想是:
> 
> 掃圖->去圈點->OCR->OCR中初校->文件校對中去除常見錯誤->合併。
> 
> 這樣子從掃圖到文字檔的產生所需要的程式就可以齊備了。
> 
> 在
> 〔OCR中初校->文件校對中去除常見錯誤->合併成卷〕
> 這個過程,目前比較有問題。

「OCR中初校」,若是指 OCR線上校對,那是OCR軟體的操作範圍,我們能幫
什麼忙?

「文件校對中去除常見錯誤」,若是指「線上粗略校對」後,針對該文件予
以文書處理,我們倒是可以幫些忙。例如,如果是我,我會利用漢書來編輯
文件,並製作一個替換巨集,把常見錯誤替換掉。可是很多人並不會這些技
倆,像郁婷,她就只會一個一個來替換。所以,我想可以在這裡動點腦筋,
讓使用者自由建立「錯誤→正確」對照表,他只要指定相關文件,程式就會
自動去做替換處理。

另外,提一下。關於丹青黃金版,前幾天我去郁婷那邊看了一下,這一版有
個特色是可以線上搜尋、替換,不過只能一次一個來替換,無法批次處理。
她目前是逐字校,當開啟圖檔辨識完畢後,就開始一次一個來替換,然後再
開始逐字校。所以,以她這樣的流程,上段所說的設想可能對她幫忙不是很
大。

「合併成卷」,應該是有需要,也大概不難設計吧!讓使用者依序選擇欲合
併檔案,並輸入合併後的新檔名,然後GO,就成了。tone有一個小程式給我
用,你們可以試試(下函另外再附檔送出)。這個程式叫做 Mergfile ,可
以在 win95 DOS視窗執行,它會問你兩個問題:

  1.欲合併的檔案清單之檔名?
  2.完成合併後之檔名?

對第一個問題所問的檔案內容,我通常是以在漢書指令列輸入 DIR來取得,
如下:

  F430001 .TXT
  F430011 .TXT
  F430016 .TXT
  F430017 .TXT
  F430018 .TXT
  F430019 .TXT
 
> 因為掃圖的人員,他們作的非常好。這部分問題不大。就算要轉檔,那都是
> 電腦在累,人是很輕鬆的。
> 
> 倒是校對和檔案合併...蠻頭大的。
> 
> 新增〔文件校對〕的功能是想說這方面看能不能多少幫上一點忙。

動動腦筋,先不要想像這是個什麼偉大的程式,我相信它至少一定可以達到
方便實用的目的。
 
******************************************************************

Subject: Re: 好東西來囉!
   Date: Sun, 28 Dec 1997 17:20:46 +0800
   From: Quiz <ycc18@tcts.seed.net.tw>

您好:
>> 這很奇怪。大部分掃描程式應該都有支援 TIF G4 。
>> 我從您那邊收到的都是 G4 的格式。
>
>NO! NO! 大部份掃瞄程式都不支援 TIF G4。
>您收到的 TIF檔,都是徐言輝在掃瞄成一般 TIF檔後再轉換成 TIF G4。

喔,可能是我運氣比較好或不好。
 
>像黃郁婷目前針對30冊大正藏所掃瞄出來的圖檔,全都是一般的 TIF圖檔。
>為了節省儲存資料空間,所以我們要將一般 TIF檔轉成 G4 格式。因此,我
>們以後很有可能會同時遇上一般 TIF檔以及 G4格式 TIF檔。

TOO,BAD. 這可能要看其他大德,或者等末學找到這類的函式庫才能幫上忙了。
 
>「OCR中初校」,若是指 OCR線上校對,那是OCR軟體的操作範圍,我們能幫
>什麼忙?

是的,可能不多,主要或許是在〔文件校對〕的功能中,有分自動置換,
和半自動置換。

一些常見的辨識錯誤(可能隨個人手中經文而不同)有些可以
在程式中自動置換正確的,就沒必要每次在丹青中修改。

>「文件校對中去除常見錯誤」,若是指「線上粗略校對」後,針對該文件予
>以文書處理,我們倒是可以幫些忙。例如,如果是我,我會利用漢書來編輯
>文件,並製作一個替換巨集,把常見錯誤替換掉。可是很多人並不會這些技
>倆,像郁婷,她就只會一個一個來替換。所以,我想可以在這裡動點腦筋,
>讓使用者自由建立「錯誤→正確」對照表,他只要指定相關文件,程式就會
>自動去做替換處理。

是的就是作您上面這段講的。

>另外,提一下。關於丹青黃金版,前幾天我去郁婷那邊看了一下,這一版有
>個特色是可以線上搜尋、替換,不過只能一次一個來替換,無法批次處理。
>她目前是逐字校,當開啟圖檔辨識完畢後,就開始一次一個來替換,然後再
>開始逐字校。所以,以她這樣的流程,上段所說的設想可能對她幫忙不是很
>大。

我是把他作成可以批次處理的。

>「合併成卷」,應該是有需要,也大概不難設計吧!讓使用者依序選擇欲合
>併檔案,並輸入合併後的新檔名,然後GO,就成了。tone有一個小程式給我
>用,你們可以試試(下函另外再附檔送出)。這個程式叫做 Mergfile ,可
>以在 win95 DOS視窗執行,它會問你兩個問題:
>
>  1.欲合併的檔案清單之檔名?
>  2.完成合併後之檔名?
>
>對第一個問題所問的檔案內容,我通常是以在漢書指令列輸入 DIR來取得,
>如下:
>
>  F430001 .TXT
>  F430011 .TXT
>  F430016 .TXT
>  F430017 .TXT
>  F430018 .TXT
>  F430019 .TXT
>

是的,也差不多就是這些。只是把這類的動作轉成圖形化操作。
另外就是加上從哪一行開始,到哪一行結束。...(有點誇張...:p)
 
>> 因為掃圖的人員,他們作的非常好。這部分問題不大。就算要轉檔,那都是
>> 電腦在累,人是很輕鬆的。
>> 
>> 倒是校對和檔案合併...蠻頭大的。
>> 
>> 新增〔文件校對〕的功能是想說這方面看能不能多少幫上一點忙。

為掃圖的人員至上我最高的敬意。非常感激。

>動動腦筋,先不要想像這是個什麼偉大的程式,我相信它至少一定可以達到
>方便實用的目的。
> 

呵...

末學的EMAIL只能用到年底。等到有新的EMAIL帳號時,才有辦法收信。
這段時間只能發不能收。萬一有造成不便之處。敬請見諒。

喔,OCR校對,我會按時交作業。可別把我的飯碗分給別人。

HAPPY NEW YEAR.

...^_^...


閱讀文章: 第 1189/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org