看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 614/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: "Heaven" <j120006632@mail.chinatrust.com.tw>, 信區: BudaTech
標  題: [buda-tech] fgfc 第四次改版, 請幫忙測試並提供意見.
發信站: 國立中山大學網路組 Mailing List (Tue Jun  3 11:47:02 1997)
轉信站: Lion!ccnews.nsysu!buda-tech@sccid.nsysu
來  源: sccid.nsysu.edu.tw

fgfc 第四次改版,
重點有:

1. 將結果之判斷符號由 << || >> 改成 {{ || }}  避免和某些經文重覆.
(好像每版都有改 :p)
2. 這回判斷連半形也包括進來了, 而內定的忽略符號則減縮為:

    忽略半形符號為 ,.:;?! 及數字 0~9 及字母 A~Z, a~z
    忽略中文符號為(A140~A154) ,、。.•;:?!︰…‥﹐、﹒·﹔﹕﹖﹗
    而 ASCII 碼從 0 ~ 31 為控制碼, 不論有無使用外掛檔案.本程式完全忽略

    可以看出我只將控制碼, 空白及標點符號列為忽略字, 尤其是控制碼 (ascii
0~31)
    為絕對忽略, 加 /e 參數亦無用.
    原因有二, 一來考慮日前討論的組合字符號問題, 二來有特殊符號出現,
校對者應
    當關心一下是什麼符號, 若沒什麼特別意義時, 再使用加入外掛檔 
fgfcsign.txt 中
    執行 /b 參數即可.

3. 修改了 fgfc.pro 比較安全了  :p 但仍很粗糙, 下面會討論到.

這回檔案為 fgfc4.exe , 放在東坡站上及 mail 給文明兄一份, 若能給大家取回時, 
還麻煩二位 (東坡站當然是大剛兄囉!) 通知一下, 謝謝!

fgfc4.exe 內含五個檔案
========
fgfc.exe     文件比較器 -- 專為格式相異之中文文件比較用 (06/03 '97)
fgfc.pro     漢書5用的巨集, 用來輔助修正用 fgfc 所產生的比較結果
fgfcpro.txt  fgfc.pro 的用法
fgfcsign.all 若想使用 fgfcsing.txt 為外掛的忽略字, 可參考此檔
readme.txt   說明檔 (就是上面這幾行說明)
=========

再者, 由於較好的尋找相同段落的邏輯, 還在和別人討論中, 我想一時無法有結果,
但目前的邏輯已為堪用, 故這回改版重點就放在半形字判斷的重點上. 
這部份解決後, 日後有較好的尋找相同段落邏輯出現, 亦不影響這部份, 故先動手了.

當有了比較方式的經文出現後, 再來要如何呢? 後學當初寫了個很簡單的 fgfc.pro ,

是用在漢書5的巨集, 可以較方便的將比較版經文直接改成校對的版本.
但在實務上呢? 這要請教寶源兄及文明兄了, 因為您們在處理時, 似乎重點並不是在
修改經文, 使其變成一個沒有錯字的版本 (若有原稿來稿對) ,
而是在列出其二篇文章
的差異性, 如同以前寶源兄所做及日前文明兄所 post 二篇中論的比較. 如

>>     若法是無者  是<<即||則>>無有滅  譬如第二頭  無故不可斷
>
>「妙雲集」: 則
>「大正藏」: 即
>「佛教藏」: 即
>
>★「大正藏」註解:即=則。

那是很辛苦的工作, 那我寫的那個巨集就用不上了, 故這裡要請較有實務經驗的
前賢們, 您們希望電腦能做到什麼地步, 能讓您們的工作能更方便! 若後學有能力
自當盡力而為.

很感謝那些經典輸入及校對的人, 後學僅希望能盡點棉薄之力, 讓他們在工作上
能有更大的方便性.

  Heaven
閱讀文章: 第 614/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org