您有新信

 
Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#1
發信站: National Sun Yet San University (m2.dj.net.tw>, 信區: BudaTech)
/6F wrote:
> 
> Heaven wrote:
> >
> > > 全形符號容易被使用在經文中,所以儘量不考慮。另外,全形佔兩個bytes,
> > > 所處理後的結果恐怕容易超過螢幕寬度,在操作上、視覺上有些不便。
> >
> >   經文中不易出現的符號是比較要注意的地方,
> >   而全形則不是問題, 因為我們用 <<||>> 各二個半形, 也等於一個全形了  :)
> 
> 對啊,您說的是,我有點糊塗了。
> 
> >   因為我聽說有的組合字是大括號, 中括號, 小括號一起使用, 故找個
> >   顯眼又不易出現的全形(或半形)就可以了.
> >
> >   Heaven
> 
> 就我所接觸的在佛典資々丑A以全形符號來說,<>《》()【】都是常見的,
> {}比較少見;以半形符號來說,<><<>>()[]也是常見的,{}也比較少見。所以
> 可以考慮{齱b或是{{||}}。
> 
如果可以將一般使用者的資料格式與資料處理者的資料格式格式加以區隔, 則問題
就簡單多了, 例如 home page 的資料處理者的資料格式格式是 html,
而一般使用者
所見的資料是 hypermedia.

-- 
------------------------------------------------------------------------
張文明
日月工作室
voice: 886-2-658-0270 (home)
email: dnstudio@m2.dj.net.tw 或 wmc@mozart.seed.net.tw
電子佛教藏經閣: http://w5.dj.net.tw/~DNStudio/canon 或
http://www.tyba.org.tw/canon
Fri May 16 12:52:35 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#2
發信站: National Sun Yet San University (m2.dj.net.tw>, 信區: BudaTech)
/6F wrote:
> 
> >
> >   其實用全形應也不成問題, 如【如是我聞※茹我是開】
> >   夠顯眼吧! (酷吧!)
> >
> >   只要是佛經中不易見到的符號, 都可以考慮的.
> >
> >   Heaven
> 
> 因為還要考慮到以您所撰寫的漢書巨集處理後半段作業,所以要盡量避開經文
> 當中可能出現的符號,免得巨集的搜尋出狀況。
> 
> 例如【【小品經序】※<小品經序>】
> 
> 全形符號容易被使用在經文中,所以儘量不考慮。另外,全形佔兩個bytes,
> 所處理後的結果恐怕容易超過螢幕寬度,在操作上、視覺上有些不便。
> 
是否應盡量以普遍性為原則來進行內部資料結構的設計, 而不受限於特定的軟體,
尤其是特定軟體的特定(巨集)語法, 特定的部份可作為 options; 另, 
presentation 的方式, 基本上是可以與內部資料結構所顯現的方式分開, 如之前
所提運用顏色來 present,
但內部儲存的資料的方式則可以利用特殊的符號或語法.
Fri May 16 12:49:01 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#3
發信站: National Sun Yet San University (m2.dj.net.tw>, 信區: BudaTech)
Heaven wrote:
> 
> 先說聲抱歉, 這版完成的很草率, 後學只試過幾次, 將會當機的
> bug 捉出來後, 就很懶了, 於是就丟上來,
> 寫程式的人很怕測試.... 就算是我的理由吧!  :(
> 
寫程式本就是壓炸腦力的事, 也是很傷神的事; 自己寫的程式自己再怎麼
測試也抓不完 bug(我, 法兩執), 穩定的程式都是別人一測再測的結果, 
所以測試的工作能交給別人就交給別人, 這是很正常的; 你的程式如果
是 windows 版, 倒可以用 ms test 來作自動測試的工作.

> 
> > 這問題只是個小瑕疵,要修正它只怕有點麻煩。
> 
> > 阿那律
> > 阿[少/兔]樓馱
> > 阿<<那律||少/兔]樓馱>>
> > 阿[<<少/兔]樓馱||那律>>
> 
> 哇! 果然是大問題, 但是這個要如何解決????
> 待後學用力想一想了.
> 
看結果, 應該是對缺字與比對的差別符號間的定義再嚴謹點就可以.

一直未有時間玩玩此程式, 所以僅能先作觀念性的建議 :( 

-- 
------------------------------------------------------------------------
張文明
日月工作室
voice: 886-2-658-0270 (home)
email: dnstudio@m2.dj.net.tw 或 wmc@mozart.seed.net.tw
電子佛教藏經閣: http://w5.dj.net.tw/~DNStudio/canon 或
http://www.tyba.org.tw/canon
Fri May 16 12:51:29 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#4
發信站: National Sun Yet San University (m2.dj.net.tw>, 信區: BudaTech)
/6F wrote:
> 
> > > 第二個是發生在咒語的段落,A本原文第一行是「安爾 曼爾 摩
> > > 禰」,B本原文第一行是「安爾(一)曼爾(二)摩禰(三)」。因為B
> > > 本含有咒語計數,A本則沒有,所以也造成一陣混亂。
> >
> >   試試把一二三... 九十列入忽略符號... 當然, 這是不負責的作法  :p
> >   因為或許原文就有數字, 如上想法, 以差異太大為由, 手動解決.
> 
> 對的,大正藏原文就有數字。我看A只好手動解決了。
> 
考慮考慮 mark-up 的方法, mark-up 就是如 html 的 tag 的語法.

-- 
------------------------------------------------------------------------
張文明
日月工作室
voice: 886-2-658-0270 (home)
email: dnstudio@m2.dj.net.tw 或 wmc@mozart.seed.net.tw
電子佛教藏經閣: http://w5.dj.net.tw/~DNStudio/canon 或
http://www.tyba.org.tw/canon
Fri May 16 12:54:27 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#5
發信站: National Sun Yet San University (mail.chinatrust.com.tw>, 信區: BudaTech)
> 送件者: Wen-Ming Chang <dnstudio@m2.dj.net.tw>
> >   其實用全形應也不成問題, 如【如是我聞※茹我是開】
> 是否也可考慮用顏色來加以區別.

  因為後來的動作可能是在漢書或 pe2 處理, 所以顏色可能無法加上去.
  (您應該說是加上 ansi 控制碼吧?)

> 就我所接觸的在佛典資料中,以全形符號來說,<>《》()【】都是常見的,
> {}比較少見;以半形符號來說,<><<>>()[]也是常見的,{}也比較少見。所以
> 可以考慮{齱b或是{{||}}。

  其實符號有很多種, 這種的如何 ◢如是我聞▼茹我是開◣  :p
  (看來就是我好像喜歡用一眼看去黑黑的符號)

  若真考慮{齱b或是{{||}}, 我想{ 比較會不小心用到, {{ 連續二個若真
  用到, 也太不小心了...

  Heaven
Fri May 16 12:55:35 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#6
發信站: National Sun Yet San University (tpts1.seed.net.tw>, 信區: BudaTech)
Heaven wrote:
> 
> > 送件者: Wen-Ming Chang <dnstudio@m2.dj.net.tw>
> > >   其實用全形應也不成問題, 如【如是我聞※茹我是開】
> > 是否也可考慮用顏色來加以區別.
> 
>   因為後來的動作可能是在漢書或 pe2 處理, 所以顏色可能無法加上去.
>   (您應該說是加上 ansi 控制碼吧?)
 
另一種使文字加上顏色的方式,就是類似WORD的文件。當初您不是考慮到
wordbasic嗎?如果後段作業不是在漢書(for DOS)上,而是在WORD上頭
,那麼標上顏色是非常漂亮的。不過,量力而為吧,實用就好啦。大家給
你的建議,希望不會造成壓力。

> > 就我所接觸的在佛典資料中,以全形符號來說,<>《》()【】都是常見的,
> > {}比較少見;以半形符號來說,<><<>>()[]也是常見的,{}也比較少見。所以
> > 可以考慮{齱b或是{{||}}。
> 
>   其實符號有很多種, 這種的如何 ◢如是我聞▼茹我是開◣  :p
>   (看來就是我好像喜歡用一眼看去黑黑的符號)

您這組倒是很帥,不錯哦!只是有些人在經文前後,常以這類全形符號來
美化版面。
 
>   若真考慮{齱b或是{{||}}, 我想{ 比較會不小心用到, {{ 連續二個若真
>   用到, 也太不小心了...


摩訶工作室.吳寶原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
Fri May 16 15:20:17 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#7
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
> > > 是否也可考慮用顏色來加以區別.
> >   因為後來的動作可能是在漢書或 pe2 處理, 所以顏色可能無法加上去.
> 另一種使文字加上顏色的方式,就是類似WORD的文件。

  有關  word 部份, 我想是可以在讀入 word 之後, run 支巨集, 將 {{ || }}
  用不同顏色隔開, 這點應不成問題, 所以程式不用另外處理.

  但.... 讀入  word 要作什麼?  因為我還沒想到如何在 word 下自動找出
  二篇文章之差異並幫助我們修改  :p

  上回那個簡單的漢書巨集有人試用過嗎? 我是指試著去修改一整篇文章, 
  我想了解在使用上有何不方便之處, 目前我只知道在修正時游標不要亂動, 
  否則會找不到家  :)

  Heaven
Fri May 16 18:48:26 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#8
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
> > > 阿那律
> > > 阿[少/兔]樓馱
> > > 阿<<那律||少/兔]樓馱>>
> > > 阿[<<少/兔]樓馱||那律>>
> 看結果, 應該是對缺字與比對的差別符號間的定義再嚴謹點就可以.

  我想了一下, 這點程式可能無法判斷, 目前想法是靠漢書巨集加上人來判斷, 
  後學再想看看好了.

> 一直未有時間玩玩此程式, 所以僅能先作觀念性的建議 :(

  其實張兄提了不少建議, 但後學有些看不太懂, 希望張兄有空能
  再多指點一下, 謝謝  :)

  Heaven
Fri May 16 18:49:43 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#9
wmc
發信站: 國立中山大學網路組 Mailing List (mozart.seed.net.tw , 信區: BudaTech)
Heaven wrote:
> 
> > > > 阿那律
> > > > 阿[少/兔]樓馱
> > > > 阿<<那律||少/兔]樓馱>>
> > > > 阿[<<少/兔]樓馱||那律>>
> > 看結果, 應該是對缺字與比對的差別符號間的定義再嚴謹點就可以.
> 
引用的前文太少, 我有點不知在談啥了; 應該是要說在程式內要把缺字組字
當作一個字來處理. 因此比較結果才會是:
 阿<<那律||[少/兔]樓馱>>
 阿<<[少/兔]樓馱||那律>>
以上如果文不對題, 還請包涵.

>   我想了一下, 這點程式可能無法判斷, 目前想法是靠漢書巨集加上人來判斷,
>   後學再想看看好了.
> 
漢書實在不熟幫不上忙, word 我還可以, 不過不知要判斷?

>   其實張兄提了不少建議, 但後學有些看不太懂, 希望張兄有空能
>   再多指點一下, 謝謝  :)
> 
其實早就想, 現在插花又好像使不上力, 多包涵囉.
Fri May 16 19:54:38 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#10
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
Heaven wrote:
> 
>   上回那個簡單的漢書巨集有人試用過嗎? 我是指試著去修改一整篇文章,
>   我想了解在使用上有何不方便之處, 目前我只知道在修正時游標不要亂動,
>   否則會找不到家  :)

說實在的,使用時真的不能亂動游標,不然不但會找不到家,甚至會無故
去掉一大區塊文字。這本來是後面才要跟你討論的,因為我覺得那個問題
應該不難解決。

還有,很重要的一個題外話,不知道你看到公告沒有,我們這   mailing 
list 的信件已經自動轉上 tw.bbs.soc.religion.buddhism。對於這fgfc
程式的討論,我想 tw.bbs.soc.religion.buddhism 的參與者一定看得滿
頭霧水,因為他們看不到我們之前的一堆討論。所以,您看怎麼辦?


摩訶工作室.吳寶原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
Fri May 16 23:42:55 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#11
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
wmc wrote:
> 
> Heaven wrote:
> >
> > > > > 阿那律
> > > > > 阿[少/兔]樓馱
> > > > > 阿<<那律||少/兔]樓馱>>
> > > > > 阿[<<少/兔]樓馱||那律>>
> > > 看結果, 應該是對缺字與比對的差別符號間的定義再嚴謹點就可以.
> >
> 引用的前文太少, 我有點不知在談啥了; 應該是要說在程式內要把缺字組字
> 當作一個字來處理. 因此比較結果才會是:
>  阿<<那律||[少/兔]樓馱>>
>  阿<<[少/兔]樓馱||那律>>
> 以上如果文不對題, 還請包涵.
> 
> >   我想了一下, 這點程式可能無法判斷, 目前想法是靠漢書巨集加上人來判斷,
> >   後學再想看看好了.

我想fgfc在執行時,因為內定值省略了全形及半形符號,也就是忽視這些符號
而通通不予比較,所以其執行結果中對於符號的處理有些失當。

假設fgfc在執行時,把重要的全形符號(如:「」『』()【】%∞+-◎)
及半形符號(如:()[]<>/*+-@)也列入比較範圍,我想大概就不會這樣了。

想歸想,我動手試驗了一下。這次捨棄內定值,採取自定值,我在 Fgfcsign.
txt 裡面放了以下七個全形符號--,。;:?!--表示只忽略這些符號不比
較,其它的通通要比較。然後下達指令來比較AB兩本法華經:
  fgfc /e fg0262a.txt fg0262b.txt a.txt b.txt x.txt 100 4
結果呢,差異太多,程式中斷。我試著擴大「最大容許差異的中文字數」,從
120、150、180都不行,直到 200才順利完成。

從底下這個例子可以看出我上面的猜測大概沒錯。

  A本原文      阿(ㄋㄡˊ)樓馱
  B本原文      阿[少/兔]樓馱

【上次使用內定值的結果】
  A本處理結果  阿(<<ㄋㄡˊ||少/兔>>)樓馱
  B本處理結果  阿[<<少/兔||ㄋㄡˊ>>]樓馱

【這次採用自定值的結果】
  A本處理結果  阿<<(ㄋㄡˊ)||少/兔>>樓馱
  B本處理結果  阿[<<少/兔||(ㄋㄡˊ)>>]樓馱

請注意,全形小括號搞對了吧!但是,半形中括號還是老樣子;可見,半形符
號仍是這個程式不予比較的東西。記得 heaven 說過,若連半形符號也要比較
,得要大費周章。不過,假如能讓使用者自訂所要比較的半形符號,那麼今天
討論的這個問題可能就有解了。


摩訶工作室.吳寶原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
Sat May 17 01:12:43 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#12
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
Heaven wrote:
>
>   有關  word 部份, 我想是可以在讀入 word 之後, run 支巨集, 將 {{ || }}
>   用不同顏色隔開, 這點應不成問題, 所以程式不用另外處理.
> 
>   但.... 讀入  word 要作什麼?  因為我還沒想到如何在 word 下自動找出
>   二篇文章之差異並幫助我們修改  :p
> 
>   上回那個簡單的漢書巨集有人試用過嗎? 我是指試著去修改一整篇文章,
>   我想了解在使用上有何不方便之處, 目前我只知道在修正時游標不要亂動,
>   否則會找不到家  :)

針對你所寫的漢書巨集,我再做兩點補充:

  1.操作巨集鍵時,得先執行ALT+1這個巨集鍵,然後才可以執行ALT+2或ALT+3,
    。如果不這樣,當你按錯了,第一次就按到ALT+2或ALT+3,那麼後果可能會
    很慘的,也就是我前函所指的無故被刪掉一大塊文字。

  2.因為這幾個巨集鍵的作用,ALT+1 是找到文字差異處,接著的ALT+2及ALT+3
    皆同時會對所開啟的A、B兩檔進行差異處的修改,也就是當你按 ALT+2或
    ALT+3 時,A、B兩檔一前一後都被修改了。
    那麼問題就來了,如果操作上稍一不慎而導致改錯資料時,因為漢書在這種
    狀況只能undo一次,但是剛才的動作是修改了A檔及B檔,所以只能將一個
    檔案恢復成修改前狀態,另一個檔案則無法undo回來。這個很麻煩的,可能
    整個修改動作得要從頭來過才比較保險。
    這種情況若是在WORD上頭,我想undo不是問題。所以改成以WORD來完成後段
    作業,除了可以文字顏色清楚顯示差異處外,至少也有undo這個好處。(聽
    說WORD可以讓你後悔一百次。)


摩訶工作室.吳寶原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
Sat May 17 02:19:13 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#13
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
寫一下前因後果, 也希望大家能一起幫忙.
若您能花點時間看這一篇, 或許可以省下不少時間參考舊信  :)

> 還有,很重要的一個題外話,不知道你看到公告沒有,我們這   mailing 
> list 的信件已經自動轉上 tw.bbs.soc.religion.buddhism。對於這fgfc
> 程式的討論,我想 tw.bbs.soc.religion.buddhism 的參與者一定看得滿
> 頭霧水,因為他們看不到我們之前的一堆討論。所以,您看怎麼辦?

因有不少朋友在做佛典電子化的工作, 因鑑於有些文章已由不同的朋友重覆輸入, 
故有人想到一個好點子 (後學覺得想這個點子的人很天才耶) 將不同人輸入的文章
拿來做比較, 找出其中的差異, 如此就很快能找出輸入的錯誤或版本不同的地方.
由比較結果再來參照原始輸入的版本, 如此就能很快校對出大部份的錯誤, 除非二
人都在同一個地方輸入錯誤, 但這實在是太巧了吧  ...

後學不才, 略懂程式設計, 故動手寫了一支小程式叫 FGFC ,
工作原理大概是將二篇文
章讀入, 略去一切半形英文符號及部份全形中文符號 (中文符號以第一個 BYTE > 127

為判斷方法) , 比較後產生三個檔, 二個為依原輸入格式, 一個為差異比較表.
舉例如下:
(底下為執行 "FGFC A B AA BB XX 5 2" 的結果)

=======文章A===========
床前明月光, 疑是天上霜.
舉頭望月亮, 低頭思故鄉.

=======文章B===========
窗前明月光,
疑是地上霜。
舉頭望明月,
低頭想故鄉。

======比較結果 AA======
<<床||窗>>前明月光, 疑是<<天||地>>上霜.
舉頭望<<月亮||明月>>, 低頭<<思||想>>故鄉.

======比較結果 BB======
<<窗||床>>前明月光,
疑是<<地||天>>上霜。
舉頭望<<明月||月亮>>,
低頭<<想||思>>故鄉。

====== 比較結果差異表 XX======
******* A
     1: 床
******* B
     1: 窗
*******

******* A
     1: 天
******* B
     2: 地
*******

******* A
     2: 月亮
******* B
     3: 明月
*******

******* A
     2: 思
******* B
     4: 想
*******

====== 檔案比對結束 ======

看了累嗎? 希望您加油  :)

第一版的 FGFC 只產生了比較檔, 後來因為有了比較檔後, 修改的人還要看原稿, 
看比較檔, 再看電子檔, 然後查行數, 找相異處, 後學只做了一次,
才知道前人的辛苦.
故在第二版之後又產生了二份結果檔 (上例的檔 AA 及檔 BB) ,
可以看到下面這種符號.

<< (本篇文章所用的字) || (另一篇文章所用的字) >>

後學又寫了一個非常簡陃的漢書巨集指令, 用來尋找 <<||>> 符號處,
並由使用者決定
要使用第一組或第二組. 以減少尋找某行某字的時間.

問題來囉! 因為一些程式上的缺陷, 有些功能尚未解決,
希望各種專長的網友能提供意見.

1.比較邏輯的問題, 題目如下 (假設連續兩字相同則判斷為相同) :

 色空空不異色色即是空空即是色
 色不異空空不異色色即是空空即是色

 程式會比較成(好的結果)

 色  空空不異色色即是空空即是色
 色不異空空不異色色即是空空即是色

 但反過來有時會比較成(這樣就亂了)

 色  不異    空空...不異色色即是空空即是色
 色空空不異色色即是空空...即是色

 就是類似下列二組字串, OO 代表相同的,XX 代表不同的,我們要如何找出來
 而不誤判.

 OOXXXOOOO
 OOXXXXXOOOO

2. 半形符號的影響:

羅侯羅
羅[目*侯]羅

上二段比較後產生:

羅<<||目>>侯羅
羅[<<目||>>*侯]羅

如果都要使用第一組 (自己的那組) 則沒問題, 但若要用第二組, 就分別變成
Mon May 19 13:06:42 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#14
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
寫一下前因後果, 也希望大家能一起幫忙.
若您能花點時間看這一篇, 或許可以省下不少時間參考舊信  :)

> 還有,很重要的一個題外話,不知道你看到公告沒有,我們這   mailing 
> list 的信件已經自動轉上 tw.bbs.soc.religion.buddhism。對於這fgfc
> 程式的討論,我想 tw.bbs.soc.religion.buddhism 的參與者一定看得滿
> 頭霧水,因為他們看不到我們之前的一堆討論。所以,您看怎麼辦?

因有不少朋友在做佛典電子化的工作, 因鑑於有些文章已由不同的朋友重覆輸入, 
故有人想到一個好點子 (後學覺得想這個點子的人很天才耶) 將不同人輸入的文章
拿來做比較, 找出其中的差異, 如此就很快能找出輸入的錯誤或版本不同的地方.
由比較結果再來參照原始輸入的版本, 如此就能很快校對出大部份的錯誤, 除非二
人都在同一個地方輸入錯誤, 但這實在是太巧了吧  ...

後學不才, 略懂程式設計, 故動手寫了一支小程式叫 FGFC ,
工作原理大概是將二篇文
章讀入, 略去一切半形英文符號及部份全形中文符號 (中文符號以第一個 BYTE > 127

為判斷方法) , 比較後產生三個檔, 二個為依原輸入格式, 一個為差異比較表.
舉例如下:
(底下為執行 "FGFC A B AA BB XX 5 2" 的結果)

=======文章A===========
床前明月光, 疑是天上霜.
舉頭望月亮, 低頭思故鄉.

=======文章B===========
窗前明月光,
疑是地上霜。
舉頭望明月,
低頭想故鄉。

======比較結果 AA======
<<床||窗>>前明月光, 疑是<<天||地>>上霜.
舉頭望<<月亮||明月>>, 低頭<<思||想>>故鄉.

======比較結果 BB======
<<窗||床>>前明月光,
疑是<<地||天>>上霜。
舉頭望<<明月||月亮>>,
低頭<<想||思>>故鄉。

====== 比較結果差異表 XX======
******* A
     1: 床
******* B
     1: 窗
*******

******* A
     1: 天
******* B
     2: 地
*******

******* A
     2: 月亮
******* B
     3: 明月
*******

******* A
     2: 思
******* B
     4: 想
*******

====== 檔案比對結束 ======

看了累嗎? 希望您加油  :)

第一版的 FGFC 只產生了比較檔, 後來因為有了比較檔後, 修改的人還要看原稿, 
看比較檔, 再看電子檔, 然後查行數, 找相異處, 後學只做了一次,
才知道前人的辛苦.
故在第二版之後又產生了二份結果檔 (上例的檔 AA 及檔 BB) ,
可以看到下面這種符號.

<< (本篇文章所用的字) || (另一篇文章所用的字) >>

後學又寫了一個非常簡陃的漢書巨集指令, 用來尋找 <<||>> 符號處,
並由使用者決定
要使用第一組或第二組. 以減少尋找某行某字的時間.

問題來囉! 因為一些程式上的缺陷, 有些功能尚未解決,
希望各種專長的網友能提供意見.

1.比較邏輯的問題, 題目如下 (假設連續兩字相同則判斷為相同) :

 色空空不異色色即是空空即是色
 色不異空空不異色色即是空空即是色

 程式會比較成(好的結果)

 色  空空不異色色即是空空即是色
 色不異空空不異色色即是空空即是色

 但反過來有時會比較成(這樣就亂了)

 色  不異    空空...不異色色即是空空即是色
 色空空不異色色即是空空...即是色

 就是類似下列二組字串, OO 代表相同的,XX 代表不同的,我們要如何找出來
 而不誤判.

 OOXXXOOOO
 OOXXXXXOOOO

2. 半形符號的影響:

羅侯羅
羅[目*侯]羅

上二段比較後產生:

羅<<||目>>侯羅
羅[<<目||>>*侯]羅

如果都要使用第一組 (自己的那組) 則沒問題, 但若要用第二組, 就分別變成

羅目侯羅
羅[*侯]羅

造成半形符號有的多, 有的少, 這點是因為程式本來不處理任何半形, 結果不理想.
這點有待後學再想想, 當然也希望有人能完全不依後學原來的想法, 重新想看看, 是
否有較好的方法來比較二篇文章.

3.這點比較不重要, 因為在產生二篇有比較符號 <<||>> 的文章後, 須要用些好方法
 來快速找到差異並改成我們要的版本, 之前後學是用漢書的巨集寫了一個, 但不夠好
, 而且有加上第二個問題半形造成的困擾, 所以目前並沒有打算這方面改良, 直到前
  面的問題解決, 有了較正確的結果檔後, 才能依結果檔來做進一步的處理.
  當初有想到用  Word Basic 來處理, 想像中的畫面是讀入二篇文章後,
出現一個對話
  框, 並有下列的按鈕, 計功能有: 

  找到下一個 <<||>> 處 (還有不同的顏色來表示) , 
  取用第一組, 
  取用第二組, 
  皆取用第一組 (表示二者都可以, 尊重原輸入者或原版本), 
  二皆皆有錯, 並由使用者輸入正確的文字.
  
  並且在取用前還先預視取用後的結果, 嗯... 想起來就不錯,   

> 送件者: wmc <wmc@mozart.seed.net.tw>
> 漢書實在不熟幫不上忙, word 我還可以, 不過不知要判斷?

  文明兄, 您大概了解了嗎?  :p  

  大概就這三個問題, 不過第三個要等第二個解決後才能進行, 故可稍緩, 
  目前既然接上 news , 各路好手應有不少, 待收集多點意見, 再來改進, 
  後學也可稍緩改版  :p

  至於最新版的 fgfc 及漢書巨集, 待後學放上東坡站後再通知大家, 
  通常後學都放不上去, 可能又要麻煩大剛兄了 :)

  其實, 真正辛苦的, 還是那些埋首佛典輸入的朋友, 沒有他們, 這一切
  都沒有意義了.

  Heaven
Mon May 19 13:38:50 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#15
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
> 還有,很重要的一個題外話,不知道你看到公告沒有,我們這   mailing 
> list 的信件已經自動轉上 tw.bbs.soc.religion.buddhism。對於這fgfc
> 程式的討論,我想 tw.bbs.soc.religion.buddhism 的參與者一定看得滿
> 頭霧水,因為他們看不到我們之前的一堆討論。所以,您看怎麼辦?


  想到一個問題, 若有其它網友在 news 上回信,  mail list 會將那些信轉回來嗎?
  若不會, 那不就要上 news 才能看到最完整的? 那 mail list 是否也失去了當時
  成立的意義? (是否因目的特殊, 所以當初不在網路上公開討論?)

  Heaven
Mon May 19 15:01:46 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#16
發信站: 國立中山大學網路組 Mailing List (m2.dj.net.tw>, 信區: BudaTech)
> 2. 半形符號的影響:
> 
> 羅侯羅
> 羅[目*侯]羅
> 
> 上二段比較後產生:
> 
> 羅<<||目>>侯羅
> 羅[<<目||>>*侯]羅
> 
> 如果都要使用第一組 (自己的那組) 則沒問題, 但若要用第二組, 就分別變成
> 
> 羅目侯羅
> 羅[*侯]羅
> 
> 造成半形符號有的多, 有的少, 這點是因為程式本來不處理任何半形, 結果不理想.
> 這點有待後學再想想, 當然也希望有人能完全不依後學原來的想法, 重新想看看, 是
> 否有較好的方法來比較二篇文章.
> 
還是上次那句老話, 只要把缺字組字當成一個字來處理, 建議您在 command line 
options 內加一個是否要處理缺字組字的選項. 程式內比對處理時,
侯是與[目*侯]
來比, 因此 []及其內的半形符號不要在 read file 後去掉.

> 
>   文明兄, 您大概了解了嗎?  :p
> 
了解 :)

> 
>   至於最新版的 fgfc 及漢書巨集, 待後學放上東坡站後再通知大家,
>   通常後學都放不上去, 可能又要麻煩大剛兄了 :)
> 
您要不嫌棄的話, 電子佛教藏經閣也可放上一份.
Tue May 20 14:41:41 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#17
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
> > 羅侯羅
> > 羅[目*侯]羅
> > 上二段比較後產生:
> > 羅<<||目>>侯羅
> > 羅[<<目||>>*侯]羅
> 還是上次那句老話, 只要把缺字組字當成一個字來處理, 建議您在 command line 
> options 內加一個是否要處理缺字組字的選項. 程式內比對處理時,
> 侯是與[目*侯]
> 來比, 因此 []及其內的半形符號不要在 read file 後去掉.

大概是因為程式在一開始就沒規劃的很好, 比較時, 程式中讀入100個中文字後
再用  c  的函數來做字串比較, 所以我也不知如何將其視為一個字...
喔... 我忽然想到一點了, 當初我曾想到做一個不要比較的列表如下:

然==燃
唯==惟
.....

因為版本問題, 有些字是各版的差異, 可以不用比較, 若在比較時就直接忽略, 
則可以省下不少修正的時間. 您的意思是否再加上

侯==[目*侯]
侯==(目*侯)
侯==[目∞侯]
侯==(目∞侯)
.....

嗯... 這樣或許可行, 但變化大概有七十二種吧!  (開玩笑的:)

後學是有想到一個方法, 當讀入半形字時 (ascii < 128) , 自動在前面補上 ascii =
01 的字, 
如此一來在電腦中就全部都是雙位元了 (可以國際化了 :p ) , 這時就不管中文,
英文, 
先比較再說, 等到輸入時, 再將 01 除去即可.

這個想法尚未成熟, 有空還要再想看看有沒有其它問題. 至於 01
只是想找一個佛典不可會
輸入的 ascii 即可.

> >   文明兄, 您大概了解了嗎?  :p
> 了解 :)

  多謝張兄, word basic 就麻煩您傷點腦筋了 (好像在陷害您一樣  :p )

> >   至於最新版的 fgfc 及漢書巨集, 待後學放上東坡站後再通知大家,
> >   通常後學都放不上去, 可能又要麻煩大剛兄了 :)
> 您要不嫌棄的話, 電子佛教藏經閣也可放上一份.

  謝謝您了, 剛剛上東坡站, 她不讓我用匿名侵入 :(
  後學先 mail 一份給您, 待您放上網站後, 再煩麻您通知大家.
  又, 這份原 mail list 的朋友已被後學強迫收了一份, 除了 fgfc.pro (漢書巨集)
  中的判斷符號由 ((||)) 改成 <<||>> , 其餘沒變. 主要是想讓 news
上有興趣的朋友
  參考一下.

  Heaven
Tue May 20 15:43:31 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#18
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
> > > > 羅侯羅
> > > > 羅[目*侯]羅
> > > > 上二段比較後產生:
> > > > 羅<<||目>>侯羅
> > > > 羅[<<目||>>*侯]羅
> 可有兩個方式, 一個是改資料結構, 一個是改比較函數, 要看你對哪一種較熟悉; 
> ...
> > 侯==[目*侯]
> > 侯==(目*侯)
> > 侯==[目∞侯]
> > 侯==(目∞侯)
> > ...
> 如果左邊是右邊的通用字.

  因為這種方式, 我擔心要特別處理的組字會愈來愈多, 所以暫不考慮,
希望下列的想法
  能一勞永逸解決這類問題.

> > 後學是有想到一個方法, 當讀入半形字時 (ascii < 128) , 自動在前面補上
ascii =
> > 01 的字,
> > 先比較再說, 等到輸入時, 再將 01 除去即可.
> 你的意思應該是輸出時, 再將 01 除去? 

    是的, 例如讀到這種句子  
  
    佛告[羅[目*侯]羅, 

    佛   告     [  羅     [  目     *  侯     ]  羅     , 
    A6F2 A769   5B C3B9   5B A5D8   2A AB4A   5D C3B9   2C    -->
原來讀到的 ASCII
    A6F2 A769 015B C3B9 015B A5D8 012A AB4A 015D C3B9   2C    --> 
半形加上個01

   這樣一來就沒有中文英文的問題了, 全部都是雙位元, 
   如此只要把想要忽略的中英文字放在另一檔來判斷即可.
   等到要輸出時, 再去掉 01 即可.
   不知這種邏輯有沒有什麼問題? (其實我還沒花時間好好想一遍 :p )

> >   多謝張兄, word basic 就麻煩您傷點腦筋了 (好像在陷害您一樣  :p )
> Don't depend on me :) 發心容易發力難.

  我知道您是大忙人, 還有許多事靠您處理中  :)
  word basic 這部份先放著, 等有較好的比較結果後, 再來考慮後續問題好了.

  Heaven
Wed May 21 11:07:35 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#19
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
Heaven wrote:
> 
> > >   至於最新版的 fgfc 及漢書巨集, 待後學放上東坡站後再通知大家,
> > >   通常後學都放不上去, 可能又要麻煩大剛兄了 :)
> > 您要不嫌棄的話, 電子佛教藏經閣也可放上一份.
> 
> 謝謝您了, 剛剛上東坡站, 她不讓我用匿名侵入 :(

我剛剛上東坡站,好像又恢復正常了。

如果東坡狀況經常不穩,建議大剛(david)借用台大佛研中心(cbs)
的一小塊硬碟空間,專門弄個 upload 區給大家用。或許這樣對於將
upload 區資料整理到 cbs 的佛教經典系列WWW 也會比較方便。


 摩訶工作室.吳寶原
 E-mail:maha@tpts1.seed.net.tw
 Tel:(02)6741715/Fax:(02)6741716
Wed May 21 18:07:46 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#20
wmc
發信站: 國立中山大學網路組 Mailing List (mozart.seed.net.tw , 信區: BudaTech)
Heaven wrote:
> 
> 不過這個版本 mail-list 的朋友都收到過了, 若 news
> 上的朋友有興趣歡迎測試並提供意見.
> 但是, 好像沒有開啟一般使用者讀取權限, 可能要請大剛兄幫個忙了.

upload 區顧名思義只能上載而不能下載, 所以已先放在電子佛教藏經閣
http://w5.dj.net.tw/~dnstudio/canon 上, 可供 news 上的朋友下載.
Thu May 22 11:55:06 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#21
發信站: 國立中山大學網路組 Mailing List (m2.dj.net.tw>, 信區: BudaTech)
> 2. 半形符號的影響:
> 
> 羅侯羅
> 羅[目*侯]羅
> 
> 上二段比較後產生:
> 
> 羅<<||目>>侯羅
> 羅[<<目||>>*侯]羅
> 
> 如果都要使用第一組 (自己的那組) 則沒問題, 但若要用第二組, 就分別變成
> 
> 羅目侯羅
> 羅[*侯]羅
> 
> 造成半形符號有的多, 有的少, 這點是因為程式本來不處理任何半形, 結果不理想.
> 這點有待後學再想想, 當然也希望有人能完全不依後學原來的想法, 重新想看看, 是
> 否有較好的方法來比較二篇文章.
> 
還是上次那句老話, 只要把缺字組字當成一個字來處理, 建議您在 command line 
options 內加一個是否要處理缺字組字的選項. 程式內比對處理時,
侯是與[目*侯]
來比, 因此 []及其內的半形符號不要在 read file 後去掉.

> 
>   文明兄, 您大概了解了嗎?  :p
> 
了解 :)

> 
>   至於最新版的 fgfc 及漢書巨集, 待後學放上東坡站後再通知大家,
>   通常後學都放不上去, 可能又要麻煩大剛兄了 :)
> 
您要不嫌棄的話, 電子佛教藏經閣也可放上一份.
Tue May 20 14:41:41 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#22
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
> > 羅侯羅
> > 羅[目*侯]羅
> > 上二段比較後產生:
> > 羅<<||目>>侯羅
> > 羅[<<目||>>*侯]羅
> 還是上次那句老話, 只要把缺字組字當成一個字來處理, 建議您在 command line 
> options 內加一個是否要處理缺字組字的選項. 程式內比對處理時,
> 侯是與[目*侯]
> 來比, 因此 []及其內的半形符號不要在 read file 後去掉.

大概是因為程式在一開始就沒規劃的很好, 比較時, 程式中讀入100個中文字後
再用  c  的函數來做字串比較, 所以我也不知如何將其視為一個字...
喔... 我忽然想到一點了, 當初我曾想到做一個不要比較的列表如下:

然==燃
唯==惟
.....

因為版本問題, 有些字是各版的差異, 可以不用比較, 若在比較時就直接忽略, 
則可以省下不少修正的時間. 您的意思是否再加上

侯==[目*侯]
侯==(目*侯)
侯==[目∞侯]
侯==(目∞侯)
.....

嗯... 這樣或許可行, 但變化大概有七十二種吧!  (開玩笑的:)

後學是有想到一個方法, 當讀入半形字時 (ascii < 128) , 自動在前面補上 ascii =
01 的字, 
如此一來在電腦中就全部都是雙位元了 (可以國際化了 :p ) , 這時就不管中文,
英文, 
先比較再說, 等到輸入時, 再將 01 除去即可.

這個想法尚未成熟, 有空還要再想看看有沒有其它問題. 至於 01
只是想找一個佛典不可會
輸入的 ascii 即可.

> >   文明兄, 您大概了解了嗎?  :p
> 了解 :)

  多謝張兄, word basic 就麻煩您傷點腦筋了 (好像在陷害您一樣  :p )

> >   至於最新版的 fgfc 及漢書巨集, 待後學放上東坡站後再通知大家,
> >   通常後學都放不上去, 可能又要麻煩大剛兄了 :)
> 您要不嫌棄的話, 電子佛教藏經閣也可放上一份.

  謝謝您了, 剛剛上東坡站, 她不讓我用匿名侵入 :(
  後學先 mail 一份給您, 待您放上網站後, 再煩麻您通知大家.
  又, 這份原 mail list 的朋友已被後學強迫收了一份, 除了 fgfc.pro (漢書巨集)
  中的判斷符號由 ((||)) 改成 <<||>> , 其餘沒變. 主要是想讓 news
上有興趣的朋友
  參考一下.

  Heaven
Tue May 20 15:43:31 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#23
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
> > > > 羅侯羅
> > > > 羅[目*侯]羅
> > > > 上二段比較後產生:
> > > > 羅<<||目>>侯羅
> > > > 羅[<<目||>>*侯]羅
> 可有兩個方式, 一個是改資料結構, 一個是改比較函數, 要看你對哪一種較熟悉; 
> ...
> > 侯==[目*侯]
> > 侯==(目*侯)
> > 侯==[目∞侯]
> > 侯==(目∞侯)
> > ...
> 如果左邊是右邊的通用字.

  因為這種方式, 我擔心要特別處理的組字會愈來愈多, 所以暫不考慮,
希望下列的想法
  能一勞永逸解決這類問題.

> > 後學是有想到一個方法, 當讀入半形字時 (ascii < 128) , 自動在前面補上
ascii =
> > 01 的字,
> > 先比較再說, 等到輸入時, 再將 01 除去即可.
> 你的意思應該是輸出時, 再將 01 除去? 

    是的, 例如讀到這種句子  
  
    佛告[羅[目*侯]羅, 

    佛   告     [  羅     [  目     *  侯     ]  羅     , 
    A6F2 A769   5B C3B9   5B A5D8   2A AB4A   5D C3B9   2C    -->
原來讀到的 ASCII
    A6F2 A769 015B C3B9 015B A5D8 012A AB4A 015D C3B9   2C    --> 
半形加上個01

   這樣一來就沒有中文英文的問題了, 全部都是雙位元, 
   如此只要把想要忽略的中英文字放在另一檔來判斷即可.
   等到要輸出時, 再去掉 01 即可.
   不知這種邏輯有沒有什麼問題? (其實我還沒花時間好好想一遍 :p )

> >   多謝張兄, word basic 就麻煩您傷點腦筋了 (好像在陷害您一樣  :p )
> Don't depend on me :) 發心容易發力難.

  我知道您是大忙人, 還有許多事靠您處理中  :)
  word basic 這部份先放著, 等有較好的比較結果後, 再來考慮後續問題好了.

  Heaven
Wed May 21 11:07:35 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#24
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
Heaven wrote:
> 
> > >   至於最新版的 fgfc 及漢書巨集, 待後學放上東坡站後再通知大家,
> > >   通常後學都放不上去, 可能又要麻煩大剛兄了 :)
> > 您要不嫌棄的話, 電子佛教藏經閣也可放上一份.
> 
> 謝謝您了, 剛剛上東坡站, 她不讓我用匿名侵入 :(

我剛剛上東坡站,好像又恢復正常了。

如果東坡狀況經常不穩,建議大剛(david)借用台大佛研中心(cbs)
的一小塊硬碟空間,專門弄個 upload 區給大家用。或許這樣對於將
upload 區資料整理到 cbs 的佛教經典系列WWW 也會比較方便。


 摩訶工作室.吳寶原
 E-mail:maha@tpts1.seed.net.tw
 Tel:(02)6741715/Fax:(02)6741716
Wed May 21 18:07:46 1997
回覆 | 轉寄 | 返回

Re: fgfc 第三次改版, 請幫忙測試並提供意見.
#25
wmc
發信站: 國立中山大學網路組 Mailing List (mozart.seed.net.tw , 信區: BudaTech)
Heaven wrote:
> 
> 不過這個版本 mail-list 的朋友都收到過了, 若 news
> 上的朋友有興趣歡迎測試並提供意見.
> 但是, 好像沒有開啟一般使用者讀取權限, 可能要請大剛兄幫個忙了.

upload 區顧名思義只能上載而不能下載, 所以已先放在電子佛教藏經閣
http://w5.dj.net.tw/~dnstudio/canon 上, 可供 news 上的朋友下載.
Thu May 22 11:55:06 1997
回覆 | 轉寄 | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org