以下六封信,Quiz、Heaven、Maha、Tone──這四人到底是在說些什麼「好
糠的東西」呢?
******************************************************************
Subject: 好東西來囉!
Date: Mon, 22 Dec 1997 18:37:16 +0800
From: "Heaven" <heaven@novell.zcom.com.tw>
各位:
承 quiz 兄幫忙, 不但寫了個 bmp -> tif 的批次處理程式,
還將去點程式也給漂亮化了. 呵! 呵! 很漂亮喔!
之前有些小問題, 看來都解決了. 這二天我會再大概試看看.
本想試好再公布, 但人多比較容易捉到問題, 故先給各位玩看看.
有問題再通知我, 若沒大問題, 我就在 buda-tech 公佈並放上
ftp server 了.
他並且還有其它計畫喔! 如下, 大家四目以待了. ("四" 忘了怎麼寫了 :p)
heaven
======================
我的程式,目前正加上一頁〔文字校對〕的功能,已經快好了,
好了後我會先將程式寄給您。試用看看,若有問題,先由我這邊
將他改到堪用後,就整個PROJECT移給您。
這個〔文字校對〕的功能包含跨檔案的文字尋找,置換,看圖,
檔案相加,所以您那邊假如有需要,可以繼續發展成大藏經的
檔案管理。乃至簡單的讀經,檢索功能。
呵...別嚇到了,移轉給您後,我還是STAND BY YOUR SIDE.
大家加油囉。
Have a nice day.
Quiz...
******************************************************************
Subject: Re: 好東西來囉!
Date: Tue, 23 Dec 1997 02:18:32 +0800
From: maha <maha@tpts1.seed.net.tw>
Heaven wrote:
>
> 承 quiz 兄幫忙, 不但寫了個 bmp -> tif 的批次處理程式,
> 還將去點程式也給漂亮化了. 呵! 呵! 很漂亮喔!
的確很漂亮喔!不管外觀或操作性都不錯。
在設計上,如要玩去點遊戲,目前只接受G4格式的 tif檔,一般格式的
tif 檔還無法接受,這個是可以再想想的。因為我們一般利用掃瞄軟體
所掃瞄出來的皆只是一般格式的 tif檔,沒道理還要將它轉成 bmp檔,
然後再又轉成 G4 tif ,繞個大圈才能處理去點。
我的意思是說,在去點方面,看能不能設計成能夠接受一般 tif檔及G4
格式 tif檔;那個需要繞圈的部份,由程式在暗地裡解決就好了。
Quiz wrote:
>
> 我的程式,目前正加上一頁〔文字校對〕的功能,已經快好了,
> 好了後我會先將程式寄給您。試用看看,若有問題,先由我這邊
> 將他改到堪用後,就整個PROJECT移給您。
>
> 這個〔文字校對〕的功能包含跨檔案的文字尋找,置換,看圖,
> 檔案相加,所以您那邊假如有需要,可以繼續發展成大藏經的
> 檔案管理。乃至簡單的讀經,檢索功能。
看來,越來越好玩了,這將是我們期待的整合性電子佛典工具程式吧!
******************************************************************
Subject: Re: 好東西來囉!
Date: Fri, 26 Dec 1997 13:22:50 +0800
From: "K.Y.T." <tone@tpts1.seed.net.tw>
Heaven wrote:
>
> 承 quiz 兄幫忙, 不但寫了個 bmp -> tif 的批次處理程式,
> 還將去點程式也給漂亮化了. 呵! 呵! 很漂亮喔!
>
> 之前有些小問題, 看來都解決了. 這二天我會再大概試看看.
> 本想試好再公布, 但人多比較容易捉到問題, 故先給各位玩看看.
> 有問題再通知我, 若沒大問題, 我就在 buda-tech 公佈並放上
> ftp server 了.
我在 DOS 下的 Windows 3.1 執行,會看不到選單的 title 文字,
所以一開始我還以為只有一個 bmp-->tif 功能,因為看不到另外
一個去點程式的選單(我不知該如何說這個名詞,只好以選單稱之)。
雖然看不到,但 mouse 依然可以盲選來運作。可能講的不是很
清楚,請 quiz 兄在 DOS6.22 下執行 win31 就知道了。
加油!
******************************************************************
Subject: Re: 好東西來囉!
Date: Sat, 27 Dec 1997 18:30:59 +0800
From: "QUIZ" <ycc18@tcts.seed.net.tw>
> 在設計上,如要玩去點遊戲,目前只接受G4格式的 tif檔,一般格式的
> tif 檔還無法接受,這個是可以再想想的。因為我們一般利用掃瞄軟體
> 所掃瞄出來的皆只是一般格式的 tif檔,沒道理還要將它轉成 bmp檔,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
這很奇怪。大部分掃描程式應該都有支援 TIF G4 。
我從您那邊收到的都是 G4 的格式。
> 然後再又轉成 G4 tif ,繞個大圈才能處理去點。
可能以前並沒有詳細規劃,或者經驗不夠。
> 我的意思是說,在去點方面,看能不能設計成能夠接受一般 tif檔及G4
> 格式 tif檔;那個需要繞圈的部份,由程式在暗地裡解決就好了。
>
請問一下還有多少這類非G4的圖檔?
文件校對那一頁的功能,其實只是跨檔案找字串,置換,和檔案依照卷期合併。
看圖。這些而已。
程式已經好了。我今天先寄給HEAVEN看看。
我的構想是:
掃圖->去圈點->OCR->OCR中初校->文件校對中去除常見錯誤->合併。
這樣子從掃圖到文字檔的產生所需要的程式就可以齊備了。
在
〔OCR中初校->文件校對中去除常見錯誤->合併成卷〕
這個過程,目前比較有問題。
因為掃圖的人員,他們作的非常好。這部分問題不大。就算要轉檔,那都是
電腦在累,人是很輕鬆的。
倒是校對和檔案合併...蠻頭大的。
新增〔文件校對〕的功能是想說這方面看能不能多少幫上一點忙。
Quiz...
******************************************************************
Subject: Re: 好東西來囉!
Date: Sun, 28 Dec 1997 00:22:40 +0800
From: maha <maha@tpts1.seed.net.tw>
QUIZ wrote:
>
> > 在設計上,如要玩去點遊戲,目前只接受G4格式的 tif檔,一般格式的
> > tif 檔還無法接受,這個是可以再想想的。因為我們一般利用掃瞄軟體
> > 所掃瞄出來的皆只是一般格式的 tif檔,沒道理還要將它轉成 bmp檔,
> ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>
> 這很奇怪。大部分掃描程式應該都有支援 TIF G4 。
> 我從您那邊收到的都是 G4 的格式。
NO! NO! 大部份掃瞄程式都不支援 TIF G4。
您收到的 TIF檔,都是徐言輝在掃瞄成一般 TIF檔後再轉換成 TIF G4。
> > 然後再又轉成 G4 tif ,繞個大圈才能處理去點。
>
> 可能以前並沒有詳細規劃,或者經驗不夠。
>
> > 我的意思是說,在去點方面,看能不能設計成能夠接受一般 tif檔及G4
> > 格式 tif檔;那個需要繞圈的部份,由程式在暗地裡解決就好了。
>
> 請問一下還有多少這類非G4的圖檔?
像黃郁婷目前針對30冊大正藏所掃瞄出來的圖檔,全都是一般的 TIF圖檔。
為了節省儲存資料空間,所以我們要將一般 TIF檔轉成 G4 格式。因此,我
們以後很有可能會同時遇上一般 TIF檔以及 G4格式 TIF檔。
> 文件校對那一頁的功能,其實只是跨檔案找字串,置換,和檔案依照卷期合併。
> 看圖。這些而已。
>
> 程式已經好了。我今天先寄給HEAVEN看看。
>
> 我的構想是:
>
> 掃圖->去圈點->OCR->OCR中初校->文件校對中去除常見錯誤->合併。
>
> 這樣子從掃圖到文字檔的產生所需要的程式就可以齊備了。
>
> 在
> 〔OCR中初校->文件校對中去除常見錯誤->合併成卷〕
> 這個過程,目前比較有問題。
「OCR中初校」,若是指 OCR線上校對,那是OCR軟體的操作範圍,我們能幫
什麼忙?
「文件校對中去除常見錯誤」,若是指「線上粗略校對」後,針對該文件予
以文書處理,我們倒是可以幫些忙。例如,如果是我,我會利用漢書來編輯
文件,並製作一個替換巨集,把常見錯誤替換掉。可是很多人並不會這些技
倆,像郁婷,她就只會一個一個來替換。所以,我想可以在這裡動點腦筋,
讓使用者自由建立「錯誤→正確」對照表,他只要指定相關文件,程式就會
自動去做替換處理。
另外,提一下。關於丹青黃金版,前幾天我去郁婷那邊看了一下,這一版有
個特色是可以線上搜尋、替換,不過只能一次一個來替換,無法批次處理。
她目前是逐字校,當開啟圖檔辨識完畢後,就開始一次一個來替換,然後再
開始逐字校。所以,以她這樣的流程,上段所說的設想可能對她幫忙不是很
大。
「合併成卷」,應該是有需要,也大概不難設計吧!讓使用者依序選擇欲合
併檔案,並輸入合併後的新檔名,然後GO,就成了。tone有一個小程式給我
用,你們可以試試(下函另外再附檔送出)。這個程式叫做 Mergfile ,可
以在 win95 DOS視窗執行,它會問你兩個問題:
1.欲合併的檔案清單之檔名?
2.完成合併後之檔名?
對第一個問題所問的檔案內容,我通常是以在漢書指令列輸入 DIR來取得,
如下:
F430001 .TXT
F430011 .TXT
F430016 .TXT
F430017 .TXT
F430018 .TXT
F430019 .TXT
> 因為掃圖的人員,他們作的非常好。這部分問題不大。就算要轉檔,那都是
> 電腦在累,人是很輕鬆的。
>
> 倒是校對和檔案合併...蠻頭大的。
>
> 新增〔文件校對〕的功能是想說這方面看能不能多少幫上一點忙。
動動腦筋,先不要想像這是個什麼偉大的程式,我相信它至少一定可以達到
方便實用的目的。
******************************************************************
Subject: Re: 好東西來囉!
Date: Sun, 28 Dec 1997 17:20:46 +0800
From: Quiz <ycc18@tcts.seed.net.tw>
您好:
>> 這很奇怪。大部分掃描程式應該都有支援 TIF G4 。
>> 我從您那邊收到的都是 G4 的格式。
>
>NO! NO! 大部份掃瞄程式都不支援 TIF G4。
>您收到的 TIF檔,都是徐言輝在掃瞄成一般 TIF檔後再轉換成 TIF G4。
喔,可能是我運氣比較好或不好。
>像黃郁婷目前針對30冊大正藏所掃瞄出來的圖檔,全都是一般的 TIF圖檔。
>為了節省儲存資料空間,所以我們要將一般 TIF檔轉成 G4 格式。因此,我
>們以後很有可能會同時遇上一般 TIF檔以及 G4格式 TIF檔。
TOO,BAD. 這可能要看其他大德,或者等末學找到這類的函式庫才能幫上忙了。
>「OCR中初校」,若是指 OCR線上校對,那是OCR軟體的操作範圍,我們能幫
>什麼忙?
是的,可能不多,主要或許是在〔文件校對〕的功能中,有分自動置換,
和半自動置換。
一些常見的辨識錯誤(可能隨個人手中經文而不同)有些可以
在程式中自動置換正確的,就沒必要每次在丹青中修改。
>「文件校對中去除常見錯誤」,若是指「線上粗略校對」後,針對該文件予
>以文書處理,我們倒是可以幫些忙。例如,如果是我,我會利用漢書來編輯
>文件,並製作一個替換巨集,把常見錯誤替換掉。可是很多人並不會這些技
>倆,像郁婷,她就只會一個一個來替換。所以,我想可以在這裡動點腦筋,
>讓使用者自由建立「錯誤→正確」對照表,他只要指定相關文件,程式就會
>自動去做替換處理。
是的就是作您上面這段講的。
>另外,提一下。關於丹青黃金版,前幾天我去郁婷那邊看了一下,這一版有
>個特色是可以線上搜尋、替換,不過只能一次一個來替換,無法批次處理。
>她目前是逐字校,當開啟圖檔辨識完畢後,就開始一次一個來替換,然後再
>開始逐字校。所以,以她這樣的流程,上段所說的設想可能對她幫忙不是很
>大。
我是把他作成可以批次處理的。
>「合併成卷」,應該是有需要,也大概不難設計吧!讓使用者依序選擇欲合
>併檔案,並輸入合併後的新檔名,然後GO,就成了。tone有一個小程式給我
>用,你們可以試試(下函另外再附檔送出)。這個程式叫做 Mergfile ,可
>以在 win95 DOS視窗執行,它會問你兩個問題:
>
> 1.欲合併的檔案清單之檔名?
> 2.完成合併後之檔名?
>
>對第一個問題所問的檔案內容,我通常是以在漢書指令列輸入 DIR來取得,
>如下:
>
> F430001 .TXT
> F430011 .TXT
> F430016 .TXT
> F430017 .TXT
> F430018 .TXT
> F430019 .TXT
>
是的,也差不多就是這些。只是把這類的動作轉成圖形化操作。
另外就是加上從哪一行開始,到哪一行結束。...(有點誇張...:p)
>> 因為掃圖的人員,他們作的非常好。這部分問題不大。就算要轉檔,那都是
>> 電腦在累,人是很輕鬆的。
>>
>> 倒是校對和檔案合併...蠻頭大的。
>>
>> 新增〔文件校對〕的功能是想說這方面看能不能多少幫上一點忙。
為掃圖的人員至上我最高的敬意。非常感激。
>動動腦筋,先不要想像這是個什麼偉大的程式,我相信它至少一定可以達到
>方便實用的目的。
>
呵...
末學的EMAIL只能用到年底。等到有新的EMAIL帳號時,才有辦法收信。
這段時間只能發不能收。萬一有造成不便之處。敬請見諒。
喔,OCR校對,我會按時交作業。可別把我的飯碗分給別人。
HAPPY NEW YEAR.
...^_^...