您有新信

 
Re: Fw: 比較程式 fgfc.arj 請大家提供意見
#1
發信站: National Sun Yet San University (tpts1.seed.net.tw>, 信區: BudaTech)
各位關心電子佛典的朋友:

以下針對 Heaven 所設計的文件比較程式發言,我只是站在使用者的
立場來設想。當然設計程式者也一定有更善巧的處理方式,或是也有
一些不得已的考量。反正,說出來研究研究吧!

Heaven wrote:
> 
> 有關比較程式, 後學有些問題, 希望大家提供意見.
> 若有二檔案如下, 依上述之功能, 會有下列結果:
> 
> ==== file 1 =====
> 應供正遍知明行足善逝世間解無上士
> 調御丈夫天人師佛世尊。其國名好城。
> ==============
> 
> =====file 2 =====
> 應供正遍智明行足善逝世間解無上士
> 調御丈夫天人帥弗世尊. 其國名好城.
> ==============
> 
> ===== 希望結果 ===============
> 應供正遍??知??智??明行足善逝世間解無上士
> 調御丈夫天人??師佛??帥弗??世尊。其國名好城。
> ==============

因為 file1、file2 的格式(例如:每行字數、總行數等等)可能不一
樣,那麼比較出來的結果是否可設定為兩種,第一種是以 file1原檔案
格式+差異內容,另一種是 file2原檔案格式+差異內容。表示差異內
容時,是以原檔案文字放在前面,另一檔案文字放在後面。

也就是,例如上面的「希望結果」,即是以 file1原檔案格式加上「??
知??智??」等差異內容,其中的「知」是 file1裡面的文字,而「智」
則是 file2的。

> 然後寫一 he4 巨集 , function key 舉例如下:
> 1. F1 : 找到 ?? 處
> 2. F2 : 取第一, 二 ?? 之間的字, 第二組自動除去
> 3. F3 : 取第二, 三個 ?? 之間的字, 第一組自動除去
> 4. F4 : 二組皆除去, 留下一小段空白, 自行輸入.

如果按我上面的想法,那麼上面所提的「希望結果」(兩種版本),已
經是非常好的結果了。用漢書來設定這些  function key,除了F1有些
用處外,其它三個到底有什麼妙用?
 
> 問題 : 若是二檔案如下格式, 您希望產生何種結果? 如何處理?
> 
> ==== file 1 =====
> 應供正遍知明行足善逝世間解無上士
> 調御丈夫天人師佛世尊。其國名好城。
> ==============
> 
> ==== file 2 =====
> 應供正遍知明行足善逝世間解吳
> 上土條御丈夫天人師佛世尊。其
> 國名好城。
> ==============
> 
> ==== 這種格式如何? =====
> 應供正遍知明行足善逝世間解
> ??無上士
> 調??
> ??吳
> 上土條??
> 御丈夫天人師佛世尊。其國名好城。
> ==============

若以 file1格式為主,我希望的格式如下:
============================================
應供正遍知明行足善逝世間解??無上士??吳上土??
??調??條??御丈夫天人師佛世尊。其國名好城。
==============

若以 file2格式為主,我希望的格式如下:
============================================
應供正遍知明行足善逝世間解??吳??無??
上??土條??士調??御丈夫天人師佛世尊。其
國名好城。
==============

我的意思是儘量保持住原檔案格式,因為原檔案格式當中可能包含
有輸入出處記錄,例如「大正藏第九冊電子檔」,利用這個出處記
錄,我們可以很快的完成下一個對照原輸入經本的步驟。

另外,當保留兩個原檔案的格式,我們只要把比對結果裡面的差異
內容確定出對錯,然後刪掉錯的,留住對的,那麼我們也就在訂正
訛誤的同時也還原了原檔案格式。

但是,以目前的表示方式是有問題的。若依我的想法,我們在符號
表示上及差異字數判斷上可能要再費心一下:

  1.符號:「??....??」沒有方向性,可考慮採用<[{(等具有方向
          性的符號。並且在左右符號中加入一個分隔符號,例如
          file1 
          ============================================
          應供正遍知明行足善逝世間解((無上士||吳上土))
          ((調||條))御丈夫天人師佛世尊。其國名好城。
          ============================================
          file2
          ============================================
          應供正遍知明行足善逝世間解((吳||無))
          上((土條||士調))御丈夫天人師佛世尊。其
          國名好城。
          ============================================
          這樣就可以清楚表示。而以後只要尋找||即可找出檔案
          裡面的差異所在。

  2.差異字數:上例當中「無上士調」跟「吳上土條」,只有「上
          」字一樣。那麼在 file1裡面是要表示成--
              ((無上士||吳上土))
          或是((無||吳))上((士||土))
 
> 這種格式由 HE4 來做, 是否能做到自動修正我也沒把握,

自動修正?如何可能?總得要人去翻查原書後再加以訂正吧!
 
------------------
摩訶工作室.吳寶原
E-mail:maha@tpts1.seed.net.tw
Tel:(02)6741715/Fax:(02)6741716
Sat Apr 19 19:42:35 1997
回覆 | 轉寄 | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org