看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 709/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: maha <maha@tpts1.seed.net.tw>, 信區: BudaTech
標  題: Re: 佛光大辭典光碟版=統一造字?
發信站: 國立中山大學網路組 Mailing List (Mon Jun 30 12:40:27 1997)
轉信站: Lion!ccnews.nsysu!news.nsysu!buda-tech@sccid.nsysu
來  源: sccid.nsysu.edu.tw

以下這封信是昨天在連線網路佛教版發現的,可能 budatech mailing list的朋
友們看不到,因為很值得參考,所以我把全文都引了(技術犯規),並回應於信
末。

  huiqun@usa.net wrote:
 
  大家都熱切希望中文系統到頭來不再是現在這副德性,但還要等待多久?未實現
  之前怎麼辦?大家都希望有一套統一造字,卻人人都有一套自己造的字。如果都
  不肯採納一個共同基礎,何來統一造字的力量?
  
  如果大家認為FK-DICT已經走出了一步,日後仍會繼續使用FK-DICT和其他
  FK-XXXX等電子書的話,便該接受FK-DICT的造字檔(下稱FK-EUCD),因為
  FK-EUCD會如影隨形的掛在大家的系統裡面。現在教界散布著許多造字檔,不
  見得FK-EUCD是較佳的版本。但由於FK-DICT和日後FK-XXXX等電子書的
  實用性,不妨就先以FK-EUCD作為基礎,大家同心協力把統一造字這個美夢實
  現。(其實是希望大家一起設計慧開法師和慧瑞法師,藉此因緣把統一造字的擔
  子推給他們!)
  
  弟作了一點功課,願與大家分享。但才疏學淺,一氣呵成又懶得回頭檢查,故不
  免錯誤百出,請大家不吝指正。解開夾檔FKEudc.zip(23KB如夾不上請來信索取)
  便得下列四個附件要正確閱讀附件,必須已掛上FK-DICT之Win95造字檔
  eudc.euf(1424kb)和eudc.tte(1077kb)。沒有FK-DICT的人其實也可以,只要請
  佛光山把eudc.euf和eudc.tte放到網站讓大家抓便行。有版權耶,不要叫我傳給
  你,尤其是加起來2.5MB。
  
  一、附件 Repeated.txt :
  FK-EUDC造字2653個,其中漢字1925個,梵字、日字、符號、其他共728個。
  弟只能處理漢字的部份。1925個漢字中,弟認為有77個與內建字重覆,及185
  個造字交互重覆,即共有262個重覆。弟大膽刪除,請大家提供意見。
  
  二、附件 SuCheng.txt :
  扣除262個重覆字後,實剩的漢字有1663個。弟不自量力,每個字都訂了「速
  成」輸入碼,請大家提供意見,修正後大家都可以利用此等輸入碼來抓字。尤其
  中註有38項疑問處,更請特別注意。
 
  三、附件 SuCheng.tbl :
  弟透過Win95的造字程式,把暫訂的1663組「速成」輸入碼按SuCheng.txt逐一
  鍵入,產生了關聯檔SuCheng.tbl。大家用Win95造字程式把SuCheng.tbl掛上
  後,全部1663個字都可以用「速成」輸入法抓得到。由於弟只會土法鍊鋼,或許
  鍵入時打錯字,又不懂如何可以事後編輯*.tbl檔案,所以如果有抓不到的字,
  請檢查一下其關聯碼是否錯了。(會事後編輯*.tbl檔案的請賜教一下。此外,
  弟會"修改"個別造字的關聯輸入碼,但不懂如何"拿掉"之。會的人也麻煩教一
  下。台灣微軟有夠user_friendly!)
 
  四、附件 Similar.txt :
  在1663個字中,弟有察覺相似,隨便摘錄下來有138個,分別是與內建字相似
  的56個,及造字交互相似的82個。除此以外,其他相似的字和走了眼的當然還
  有很多,這些都只是瀏覽一下隨便摘錄下來的,給大家有空時研究一下。
  
  弟只是拋磚引玉,希望這一步經過大家合力整理後,成立一個有實用性的共同基
  礎,大家可以稱之為FK-EUDC_v.1.0或什麼的。更請佛光山慈悲採納,並在日
  後應用在其他FK-XXXX電子書中,和陸續推出FK-EUDC修訂版。下一步當然
  盼望把造字分類,及按部首和筆劃重新編排次序,使應用上更一目了然。只要大
  家有個共同基礎,也就是一樣的造字檔,不怕日後一再修訂,只要用一個自動轉
  碼執行檔便行。最後更希望能幫字型整容一下,讓其大小粗細比較整齊,登其大
  雅之堂。就這樣子,見笑之處請大家包涵

--------

很佩服huiqun的研究態度及實作精神,剛看了 FKEudc.zip 裡的四個檔,我想這
一定帶給佛光山很大的幫助。竟有人抓出這麼一堆的重複字及相似字,在下很好
奇huiqun的「土法煉鋼」有何巧妙之處?

佛光山是很有能力及意願來從事電子佛典事業,但這並不是說以後中文電子佛典
就只此一家、別無分號。早在佛光辭典測試版出現前,沈家楨居士所發起的「資
功會」(EBS)已生產了「金剛經專集測試版」,而其正式版近日也發行了(
目前僅限於北美地區),為了進一步測試,我手上就有這麼一片。所以,我的電
腦早些日子是安裝中研院造字檔,前陣子是安裝著佛光山造字檔,昨天開始改安
裝資功會造字檔(大概是目前最漂亮的佛典點陣造字檔),好不熱鬧。可以想像
得出來,在未來各家中文電子佛典紛紛出爐後,我們對於造字檔的改裝一定得要
非常熟悉不可。這讓我聯想到,倒是可以寫一支中文造字檔改裝小程式,只要按
個鈕、點一下就OK了──熟悉 WINDOWS程式設計的人可以開始動手做做看哦!

如果佛典造字檔真是無法統一,上面所說的造字檔改裝程式就不是笑話。

說到「大家一起設計慧開法師和慧瑞法師,藉此因緣把統一造字的擔子推給他們
」,這個公開的陽謀,各位以為如何?

想過去這一、兩年,為了佛典造字問題,參加了幾次由中研院資訊所及台大佛研
中心合辦的研討會。個人贊同將這個問題交給教界與學界合作解決,由教界提供
實務資料,讓學界去分析整理。目前的狀況是,據我的了解,中研院早已完成佛
典補字集(現置於台大佛研中心 WWW),算是已經完成其階段性任務,但是最近
先後出版的「佛光辭典」及「金剛經專集」兩片光碟並沒有採用中研院這個造字
檔。為什麼會這樣?我不想妄加揣測,也許當事者有其不得已的苦衷吧!

我們都理論的知道統一造字檔對於中文佛典的資訊交換非常重要,但是過去有關
這方面的資訊交換量並不大,所以儘管我們叫叫叫,但其實尚未感受到什麼痛癢
,所以好像還刺激不到「運動神經」。現在,逐漸開始了,當電子佛典成品越來
越多時,那個痛苦的感覺越來越明顯;當時候到了,或許大家就會比較清醒的知
道該起來做些什麼。

                                                          maha 6/30/97


閱讀文章: 第 709/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org