您有新信

 
Re: 佛光大辭典光碟版=統一造字?
#1
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
以下這封信是昨天在連線網路佛教版發現的,可能 budatech mailing list的朋
友們看不到,因為很值得參考,所以我把全文都引了(技術犯規),並回應於信
末。

  huiqun@usa.net wrote:
 
  大家都熱切希望中文系統到頭來不再是現在這副德性,但還要等待多久?未實現
  之前怎麼辦?大家都希望有一套統一造字,卻人人都有一套自己造的字。如果都
  不肯採納一個共同基礎,何來統一造字的力量?
  
  如果大家認為FK-DICT已經走出了一步,日後仍會繼續使用FK-DICT和其他
  FK-XXXX等電子書的話,便該接受FK-DICT的造字檔(下稱FK-EUCD),因為
  FK-EUCD會如影隨形的掛在大家的系統裡面。現在教界散布著許多造字檔,不
  見得FK-EUCD是較佳的版本。但由於FK-DICT和日後FK-XXXX等電子書的
  實用性,不妨就先以FK-EUCD作為基礎,大家同心協力把統一造字這個美夢實
  現。(其實是希望大家一起設計慧開法師和慧瑞法師,藉此因緣把統一造字的擔
  子推給他們!)
  
  弟作了一點功課,願與大家分享。但才疏學淺,一氣呵成又懶得回頭檢查,故不
  免錯誤百出,請大家不吝指正。解開夾檔FKEudc.zip(23KB如夾不上請來信索取)
  便得下列四個附件要正確閱讀附件,必須已掛上FK-DICT之Win95造字檔
  eudc.euf(1424kb)和eudc.tte(1077kb)。沒有FK-DICT的人其實也可以,只要請
  佛光山把eudc.euf和eudc.tte放到網站讓大家抓便行。有版權耶,不要叫我傳給
  你,尤其是加起來2.5MB。
  
  一、附件 Repeated.txt :
  FK-EUDC造字2653個,其中漢字1925個,梵字、日字、符號、其他共728個。
  弟只能處理漢字的部份。1925個漢字中,弟認為有77個與內建字重覆,及185
  個造字交互重覆,即共有262個重覆。弟大膽刪除,請大家提供意見。
  
  二、附件 SuCheng.txt :
  扣除262個重覆字後,實剩的漢字有1663個。弟不自量力,每個字都訂了「速
  成」輸入碼,請大家提供意見,修正後大家都可以利用此等輸入碼來抓字。尤其
  中註有38項疑問處,更請特別注意。
 
  三、附件 SuCheng.tbl :
  弟透過Win95的造字程式,把暫訂的1663組「速成」輸入碼按SuCheng.txt逐一
  鍵入,產生了關聯檔SuCheng.tbl。大家用Win95造字程式把SuCheng.tbl掛上
  後,全部1663個字都可以用「速成」輸入法抓得到。由於弟只會土法鍊鋼,或許
  鍵入時打錯字,又不懂如何可以事後編輯*.tbl檔案,所以如果有抓不到的字,
  請檢查一下其關聯碼是否錯了。(會事後編輯*.tbl檔案的請賜教一下。此外,
  弟會"修改"個別造字的關聯輸入碼,但不懂如何"拿掉"之。會的人也麻煩教一
  下。台灣微軟有夠user_friendly!)
 
  四、附件 Similar.txt :
  在1663個字中,弟有察覺相似,隨便摘錄下來有138個,分別是與內建字相似
  的56個,及造字交互相似的82個。除此以外,其他相似的字和走了眼的當然還
  有很多,這些都只是瀏覽一下隨便摘錄下來的,給大家有空時研究一下。
  
  弟只是拋磚引玉,希望這一步經過大家合力整理後,成立一個有實用性的共同基
  礎,大家可以稱之為FK-EUDC_v.1.0或什麼的。更請佛光山慈悲採納,並在日
  後應用在其他FK-XXXX電子書中,和陸續推出FK-EUDC修訂版。下一步當然
  盼望把造字分類,及按部首和筆劃重新編排次序,使應用上更一目了然。只要大
  家有個共同基礎,也就是一樣的造字檔,不怕日後一再修訂,只要用一個自動轉
  碼執行檔便行。最後更希望能幫字型整容一下,讓其大小粗細比較整齊,登其大
  雅之堂。就這樣子,見笑之處請大家包涵

--------

很佩服huiqun的研究態度及實作精神,剛看了 FKEudc.zip 裡的四個檔,我想這
一定帶給佛光山很大的幫助。竟有人抓出這麼一堆的重複字及相似字,在下很好
奇huiqun的「土法煉鋼」有何巧妙之處?

佛光山是很有能力及意願來從事電子佛典事業,但這並不是說以後中文電子佛典
就只此一家、別無分號。早在佛光辭典測試版出現前,沈家楨居士所發起的「資
功會」(EBS)已生產了「金剛經專集測試版」,而其正式版近日也發行了(
目前僅限於北美地區),為了進一步測試,我手上就有這麼一片。所以,我的電
腦早些日子是安裝中研院造字檔,前陣子是安裝著佛光山造字檔,昨天開始改安
裝資功會造字檔(大概是目前最漂亮的佛典點陣造字檔),好不熱鬧。可以想像
得出來,在未來各家中文電子佛典紛紛出爐後,我們對於造字檔的改裝一定得要
非常熟悉不可。這讓我聯想到,倒是可以寫一支中文造字檔改裝小程式,只要按
個鈕、點一下就OK了──熟悉 WINDOWS程式設計的人可以開始動手做做看哦!

如果佛典造字檔真是無法統一,上面所說的造字檔改裝程式就不是笑話。

說到「大家一起設計慧開法師和慧瑞法師,藉此因緣把統一造字的擔子推給他們
」,這個公開的陽謀,各位以為如何?

想過去這一、兩年,為了佛典造字問題,參加了幾次由中研院資訊所及台大佛研
中心合辦的研討會。個人贊同將這個問題交給教界與學界合作解決,由教界提供
實務資料,讓學界去分析整理。目前的狀況是,據我的了解,中研院早已完成佛
典補字集(現置於台大佛研中心 WWW),算是已經完成其階段性任務,但是最近
先後出版的「佛光辭典」及「金剛經專集」兩片光碟並沒有採用中研院這個造字
檔。為什麼會這樣?我不想妄加揣測,也許當事者有其不得已的苦衷吧!

我們都理論的知道統一造字檔對於中文佛典的資訊交換非常重要,但是過去有關
這方面的資訊交換量並不大,所以儘管我們叫叫叫,但其實尚未感受到什麼痛癢
,所以好像還刺激不到「運動神經」。現在,逐漸開始了,當電子佛典成品越來
越多時,那個痛苦的感覺越來越明顯;當時候到了,或許大家就會比較清醒的知
道該起來做些什麼。

                                                          maha 6/30/97
Mon Jun 30 12:40:27 1997
回覆 | 轉寄 | 返回

Re: 佛光大辭典光碟版=統一造字?
#2
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
huiqun@usa.net wrote:
> 
> 關於你的「敗在速成」,弟做了如下「土法練鋼」式實驗。

(抱歉!以下若全引會過長,只好略掉。)

我家裡另有一台電腦,是我太太在用的。她的95版本比我的還新,我的是
4.00.950a,她的是4.00.950B──也就是所謂的「OSR2」版。今天偷跑去
她的電腦測試以上這個問題,結果以我之前使用 reg的方法,很順利的把
「速成」搞定了。所以,不知道這是因為我這個95版本的 bug?還是因為
我的95環境玩得太複雜了?能不能請您到[控制台]/[系統],把您的 95版
本讓我知道?

另外,在造字程式裡欲匯入 tbl時,[連結]跟[批次連結]有什麼重大不同
?我這裡常在[批次連結]時當機。微軟在這裡的使用說明,實在找不到隻
言半句!
 
> 關於「拿掉個別造字的關聯輸入」,並非拿掉整個.tbl檔連結:
> 1. 以為「佛」字是「人中」,所以抓不到,跑去自造一個。
> 2. 造好了,給它輸入碼:
>     編輯=>連結=>「人中」=>空白鍵=>登記。成功!
> 3. 錯了,「佛」字應該是「人弓」,好在可以修改:
>     編輯=>連結=>「人弓」=>空白鍵=>登記。改了!
> 4. 不對,原來「佛」字內建已有,如何把自造的拿掉?
>     唯有將它塗白,變成沒有筆劃的「  」字,而非沒有字???
> 5. 再把輸入碼拿掉:
>     編輯=>連結=>刪除「人弓」=>登記.........不行???

我試了試,確實這時候無法把此一內碼的輸入法整個拿掉,只能合理修改
,不能刪除。這真是一個缺失。不知道 win3.1以及DOS版倚天中文的情況
怎樣?對了,您那邊的電腦是不是有DOS版的倚天中文以及中文版WINDOWS
3.1 ?您知道這些使用者造字檔的輸入法表(.tbl),是不是從倚天中文
到win31到win95,都是一模一樣的格式?

最近我會針對上回您所提的問題,也就是如何編輯 tbl檔,去查一些資料
看看。您若有什麼心得,敬請公布給budatech的朋友們參考。在budatech
這裡,請不要有獻醜不獻醜的問題,只要是為了解決問題所做的思考與努
力,都是值得發表並受到注意的。

                                                     maha 7/8/97
Tue Jul 8 17:10:24 1997
回覆 | 轉寄 | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org