看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 614/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: "Heaven" <j120006632@mail.chinatrust.com.tw>, 信區: BudaTech 標 題: [buda-tech] fgfc 第四次改版, 請幫忙測試並提供意見. 發信站: 國立中山大學網路組 Mailing List (Tue Jun 3 11:47:02 1997) 轉信站: Lion!ccnews.nsysu!buda-tech@sccid.nsysu 來 源: sccid.nsysu.edu.tw fgfc 第四次改版, 重點有: 1. 將結果之判斷符號由 << || >> 改成 {{ || }} 避免和某些經文重覆. (好像每版都有改 :p) 2. 這回判斷連半形也包括進來了, 而內定的忽略符號則減縮為: 忽略半形符號為 ,.:;?! 及數字 0~9 及字母 A~Z, a~z 忽略中文符號為(A140~A154) ,、。.•;:?!︰…‥﹐、﹒·﹔﹕﹖﹗ 而 ASCII 碼從 0 ~ 31 為控制碼, 不論有無使用外掛檔案.本程式完全忽略 可以看出我只將控制碼, 空白及標點符號列為忽略字, 尤其是控制碼 (ascii 0~31) 為絕對忽略, 加 /e 參數亦無用. 原因有二, 一來考慮日前討論的組合字符號問題, 二來有特殊符號出現, 校對者應 當關心一下是什麼符號, 若沒什麼特別意義時, 再使用加入外掛檔 fgfcsign.txt 中 執行 /b 參數即可. 3. 修改了 fgfc.pro 比較安全了 :p 但仍很粗糙, 下面會討論到. 這回檔案為 fgfc4.exe , 放在東坡站上及 mail 給文明兄一份, 若能給大家取回時, 還麻煩二位 (東坡站當然是大剛兄囉!) 通知一下, 謝謝! fgfc4.exe 內含五個檔案 ======== fgfc.exe 文件比較器 -- 專為格式相異之中文文件比較用 (06/03 '97) fgfc.pro 漢書5用的巨集, 用來輔助修正用 fgfc 所產生的比較結果 fgfcpro.txt fgfc.pro 的用法 fgfcsign.all 若想使用 fgfcsing.txt 為外掛的忽略字, 可參考此檔 readme.txt 說明檔 (就是上面這幾行說明) ========= 再者, 由於較好的尋找相同段落的邏輯, 還在和別人討論中, 我想一時無法有結果, 但目前的邏輯已為堪用, 故這回改版重點就放在半形字判斷的重點上. 這部份解決後, 日後有較好的尋找相同段落邏輯出現, 亦不影響這部份, 故先動手了. 當有了比較方式的經文出現後, 再來要如何呢? 後學當初寫了個很簡單的 fgfc.pro , 是用在漢書5的巨集, 可以較方便的將比較版經文直接改成校對的版本. 但在實務上呢? 這要請教寶源兄及文明兄了, 因為您們在處理時, 似乎重點並不是在 修改經文, 使其變成一個沒有錯字的版本 (若有原稿來稿對) , 而是在列出其二篇文章 的差異性, 如同以前寶源兄所做及日前文明兄所 post 二篇中論的比較. 如 >> 若法是無者 是<<即||則>>無有滅 譬如第二頭 無故不可斷 > >「妙雲集」: 則 >「大正藏」: 即 >「佛教藏」: 即 > >★「大正藏」註解:即=則。 那是很辛苦的工作, 那我寫的那個巨集就用不上了, 故這裡要請較有實務經驗的 前賢們, 您們希望電腦能做到什麼地步, 能讓您們的工作能更方便! 若後學有能力 自當盡力而為. 很感謝那些經典輸入及校對的人, 後學僅希望能盡點棉薄之力, 讓他們在工作上 能有更大的方便性. Heaven |
閱讀文章: 第 614/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |