您有新信

 
一個總比沒有好的簡便組字法
#1
發信站: (tpts1.seed.net.tw>, 信區: BudaTech)
這個靈感得自前陣子讀到德明的信,也有感於郁婷最近在掃瞄辨識作業
上的困難。

雖然 Heaven 說倉頡造字很有成就感,但對一些門外漢或短期從事電子
佛典工作者而言,他們對這個成就感興趣缺缺,他們希望最好是通通打
大黑點,以便他們把手上的工作快快結束掉。可是,這大黑點卻是留給
往後的缺字整理者一個大爛攤子。

對於大量作業初期的缺字處理,因為參與工作者未必有足夠的專業知識
與熱情,我們實在也不必過於苛求。於是我想,或許我們可將以往的組
字法加以簡化,讓一般人以普通的習慣即可將大部份缺字形容出來。因
為並不是精確表達,所以到後來還是要再做一次缺字整理,但實在比大
黑點好太多了,因此我戲稱之為「總比沒有好」的組字法。

這個「總比沒有好」的組字法,其實行之有年,在過去很多人都是這樣
玩。基本上,它主要還是建立在過去我們所習慣的組字法上,但是:

  1.省略 +-*/@()等符號:略去邏輯運算符號,以從左至右、從上至下
    、從外至內的原則,將缺字各組成字根輸入。
    例如:[目*侯]          寫成[目侯]
          [和/心]          寫成[和心]
          [鬥@(豆*寸)]     寫成[鬥豆寸]
          [門/(人/(人*人))]寫成[門人人人]

  2.簡化偏旁的表示:對於無法輸入的偏旁部首,以現有文字依一般的
    認識來直接敘述。
    例如:[何-可+爾]寫成[人爾]
          [徒-走+扁]寫成[人人扁]
          [怡-台+在]寫成[心在]
          [折-斤+只]寫成[手只]
          [路-各+專]寫成[足專]
          [陳-東+登]寫成[耳登]
          [泳-永+替]寫成[水替]
          [萌-明+朋]寫成[草朋]
          [袱-伏+戒]寫成[衣戒]
          [猿-袁+爰]寫成[犬爰]
          [這-言+向]寫成[之向]

  3.以問號來表示字根打不出來
    例如:[鬘-曼+弟]寫成[?弟]
          [病-丙+樂]寫成[?樂]
          [爵-(舀-臼)+(木*爻*木)]寫成[木爻木四?寸]

反正,面對一個電腦打不出來的缺字,將這個缺字的字形結構分解成一
般相當的文字直接打出,有打不出來的部份就以?表示。這樣子,儘管
沒有交代上下、左右、包含等關係,但至少九成以上還是猜得出來,這
對以後的缺字整理是大有幫助的。

對於郁婷的作業,我希望她考慮一下我這個方法,讓底下的工作人員採
用這個方法,凡是遇到電腦缺字,請不要以通用字代,也不要以大正藏
底下的校勘文字代,而是儘量以這套簡便的方法保持住文字的原狀原貌。

對於佛教藏OCR小組,作業時可以採用通用字。若沒有通用字的,如
果你已經上路了,可採用之前所用的精確表示法;如果你還是不習慣,
沒關係,但請至少得採用這個「總比沒有好」的組字法。因為有了這個
新方法,所以之前所說「若缺字不好組,請打一個●來表示」,現在要
改成「若缺字不好組,請利用簡便組字法並配合?來盡量表示」。

以下是一些應用實例:

  1.爾時,世尊食時,著衣持[金本],入舍衛大城乞食(金剛經)
  2.羅[目侯]羅、憍梵波提、賓頭盧頗羅墮、迦留陀夷、摩訶劫賓那、
    薄拘羅、阿[少兔]樓馱(阿彌陀經)
  3.其二沙彌東方作佛。一名阿[門人人人]在歡喜國(法華經)
  4.離[心龍]悷心。不調故。發大車心(六十華嚴)
  5.栴檀為[草積]。供養佛身。而以燒之(法華經)
  6.右膝[足胡]跪一心合掌。恭敬供養。作如是言(六十華嚴)
  7.鼻不匾[ㄈ?虎]。亦不曲戾。面色不黑(法華經)
  8.亦如眾鳥類    出[士?卵殳]音不同(六十華嚴)

最後,特別再聲明,這是一個不得已的非常手段,專用在目前的幾個非
常狀況。我還是期盼一個讓大家輕鬆愉快且成熟有效的缺字處理方式能
夠早日誕生。


 摩訶工作室.吳寶原
 E-mail:maha@tpts1.seed.net.tw
 Tel:(02)6741715/Fax:(02)6741716
NEWS/INFO National Sun Yat-San University Tue Dec 9 11:46:15 1997
回覆 | 轉寄 | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org