您有新信

 
Re: 回maha有關大辭典新版之
#1
發信站: 國立中山大學網路組 Mailing List (mail.chinatrust.com.tw>, 信區: BudaTech)
> fkr 格式是我自己定的,乃FKRead (佛光讀經器)之前三碼。
> FKRead Convertor + user definable rules
> Pure Text --> *.fkr
> 接下來,再由另一支程式解讀fkr ,並轉成html輸出至browser
> *.fkr  ---> HTML
> 我現在正在考慮fkr的格式,要決定其規格真不容易
> 1)大家一齊來決定檔案格式,要包括那些內容,預計應有
>     經名(書名),作者,譯者,原書頁碼,版本,輸入者,提供者,
>     經文結構等。

  很高興能看到將這種規格在網路上和大家一起討論.
  一個人來訂規格的確是很不容易的事.

  看來計有
  1. Pure text : 包括各種不同的段落, 縮排... 等差異.
  2.Html 規格.
  3.FKR 規格.

  而目前現有的工作是訂定 fkr 規格並考量和其它規格的轉換性.
  再進行轉換器的製作.

  請問目前是否有 fkr 規格原形及其描述檔的樣式 (表現出來的樣子)
  若能先公佈出來一起討論, 會比較有下手處. 謝謝!

  Heaven
Wed Jun 25 09:11:31 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#2
發信站: 國立中山大學網路組 Mailing List (m2.dj.net.tw>, 信區: BudaTech)
COSINE wrote:
> 
> 新版還是會以光碟發行,只不過改成html相容,至於網路
> 版,目前還有一些技術上及非技術上的問題。我盡力試試。
> 
> 之所以用圖形方式顯示造字,有三個原因:
> 1)既然是少見到要用「造」的字,檢索的機率必定不高,何況也可以用
> ?的方式來代表所有的造字,如羅?羅,一樣可查出。
> 2)沒有造字空間的問題。
看法相同, 用圖形是末學一直在做的, 有人會問那 dos怎麼辦? 末學認為
這些 users 從市場的角度言, 是沒有必要考慮的.

> 3)現在我們面臨的最大問題不是檢索,而是造字沒有標準,沒有標準則
>    無法交換,一切都免談,所以目前最重要的工作就是建立標準,建立
造字標準?標準造字表? Excuse me. As I know we already have one. 
It is the effort by 台大佛研恆清 and 中研院莊德明. Why don't we 
keep delevelping based on this one, so the effort won't be waste.

>    一個有彈性的標準。標準一旦形成,我們就可以要求軟體系統
>    字形商,把它  build-in 在系統內,才能把造字問題解決。圖形方式
>    大家可把它視作為過渡方案。
> 
這問題的癥結應是造字空間有限的問題, 而不是廠商不 build-in 的關係.
談得更深點還可能是中文文字本身在電腦上應用的根本問題, 
例如中文字也在不斷演化增加, 只要原來的字增減一畫就是一個新字, 
目前方言字, 如廣東方言字, 閩南方言字, 中國地大人多方言也多,
將來各地方言字都出來, 恐怕在大的造字空間都不夠; 
不若拉丁字由幾個基本字母(character)來組成單字(word), 單字再多
還是由那幾個基本字母組成. 這是根本問題, 除非, 電腦字的顯示設計
從頭來過, 並由中國人主導, 這在可見的未來似乎是不可能的事.

> fkr 格式是我自己定的,乃FKRead (佛光讀經器)之前三碼。
> 有鑒於佛光大辭典上一版和其他軟體整合能力不足及
> 造字的問題,故下一版會考慮直接推出一個讀經器,
> 並定出一個新的檔案格式,方便大家交換電子佛典。
> 故它不只是電子版的辭典,更像是一個內建線上
> 解釋佛學名相的整合的讀經介面。
> 
> 我的想法是:
> 
> FKRead Convertor + user definable rules
> Pure Text --> *.fkr
> 
> 大家有自己的輸入規格A內縮,造字都不一,不可能
> 強行統一,故應可以經由可程式化的描述檔加上
> 轉換程式將各家的純文字檔轉成統一格式fkr。方便交換。
> 
> 接下來,再由另一支程式解讀fkr ,並轉成html輸出至browser
> 
>  FKRead fkr Parser and Viewer
> 
> *.fkr  ---> HTML
> 

raw text -> html -> fkread (display directly to uer interface)

If there is no format for raw text, then there is not need to 
write a parser for it. Since your application runs on Win95, 
it's best to follow  the standard interchangable text format in that, 
this format nowaday undoubtablly is html. Also, the trend on html is 
heading toward dynamic html which you will be able to make multimedia 
presentation.


> 此外,版本控制能力,檢索能力等也很重要。
MS 的 source safe 是版本控制的軟體.

> 我現在正在考慮fkr的格式,要決定其規格真不容易,如果
> 太周詳擔心implement 很困難,做不出來,太簡單又怕沒有遠見,
> 造成往後compatible的負擔,真是一個delimma。
> 佛光大辭典的coding 部份只有我一人在做,辛苦一ヮS有關係,
> 只是擔心會影響進度,讓大家久等不好意思,我有以下數點想請
> 大家幫忙,畢竟這是個不小的工程,需要整合很多技術,
> 單靠一人確實有不勝study之慨:
> 
> 1)大家一齊來決定檔案格式,要包括那些內容,預計應有
>     經名(書名),作者,譯者,原書頁碼,版本,輸入者,提供者,
>     經文結構等。
> 
從全文檢索的角度看, 這些應該要建立屬性表 (aka database)
來輔助. 記得在妙雲集程式的討論中末學已提過了.

> 2)往後在網路上我們共同來維護一份統一的造字表,用001-->?? , 002--->??表示
>    其中001 002是造字序碼,??是造字表達式,(用中研院莊先生的方法)

>    我會把這些造字做成bmp格式小圖,在讀經器內可以show出來。
>    以後佛光大辭典既然是一個讀經器,它就應該有包容各家造字的能力。
> 
末學已經在做了, 末學之前給師父的檔案中 budfont.hlp 即是.
16, 24size的 bmp已有近千字, 都是根據莊居士的造字檔.

> 3)佛光大辭典v1是用delphi 3.0 compile的,我想沒有意外的話,v2
>    也會用delphi 來做,所以請大家推薦對佛典電子化有與趣的delphi高手,
>    我想組成一個 5至10人的cyber-team 來做這做這項工作,就像老外做linux
>    的方式一樣。
> 
這是 public domain software 的做法, 師父是說佛光辭典的軟體要成為
public domain 的軟體?

> 4)我想知道大家對大辭典內圖片的看法,真的有必要每張都做進光碟去嗎?
>    因為掃描不是問題,問題是已經找不到原始的圖片了,如果用和原書不一樣的
>    圖大家可以接受嗎?
> 
是否只要原來的"專家"認可就可以了, 有圖畢竟是好的, 在電腦內也最好是
彩色的.

> 有關於佛典保存及流佈,昨天我 post 的一篇慧開法師的文章很值得參考,
> 大家有空可以看看。
> 


-- 
張文明
日月工作室
mailto: dnstudio@m2.dj.net.tw
電子佛教藏經閣: http://w5.dj.net.tw/~DNStudio/canon
Wed Jun 25 10:03:10 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#3
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
佛光山資訊中心釋慧瑞法師 wrote:
> 
> 2)往後在網路上我們共同來維護一份統一的造字表,用001-->?? , 002--->??表示
>    其中001 002是造字序碼,??是造字表達式,(用中研院莊先生的方法)

這一點,希望中研院莊先生給予建議。因為據我所了解,他們的方法也不是一成不
變的。(德明!您如果尚未加入buda-tech Mailing List,請把回函直接 mail 給
我,我再轉告大家。)
 
> 4)我想知道大家對大辭典內圖片的看法,真的有必要每張都做進光碟去嗎?
>    因為掃描不是問題,問題是已經找不到原始的圖片了,如果用和原書不一樣的
>    圖大家可以接受嗎?
 
V1.0版目前的總體積大約55Mb,還不及一張光碟容量的1/10。我覺得圖片能夠越多
越好,甚至不只是圖片,將來一定會進展到動態影像。

圖片和原書不一樣,我是能夠接受的。當進展到數位化,變成是一個新的東西,勿
需再局限於書版的內容;只要切合這個新媒體的需求,很多新路子都可以嘗試。

                                                            maha 6/25/97
Wed Jun 25 12:48:52 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#4
發信站: cms (tpts2.seed.net.tw>, 信區: Buddhism)
發信站: cms (Thu Jun 26 17:37:54 1997)
轉信站: Lion!ccnews.nsysu!suncc.ccu!news.csie.nctu!news.nctu!serv.hinet.net!net
來  源: ts1r8.hope.com.tw

> 這問題的癥結應是造字空間有限的問題, 而不是廠商不 build-in 的關係.
> 談得更深點還可能是中文文字本身在電腦上應用的根本問題, 
> 例如中文字也在不斷演化增加, 只要原來的字增減一畫就是一個新字, 
> 目前方言字, 如廣東方言字, 閩南方言字, 中國地大人多方言也多,
> 將來各地方言字都出來, 恐怕在大的造字空間都不夠; 
> 不若拉丁字由幾個基本字母(character)來組成單字(word), 單字再多
> 還是由那幾個基本字母組成. 這是根本問題, 除非, 電腦字的顯示設計
> 從頭來過, 並由中國人主導, 這在可見的未來似乎是不可能的事.

既然圖形都可使用,何不考慮朱邦復先生之聚珍碼?

中國字由中國人主導當非難事,為與不為而已。
Thu Jun 26 17:37:54 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#5
發信站: 國立中山大學網路組 Mailing List (tpts1.seed.net.tw>, 信區: BudaTech)
cms wrote:
> 
> 既然圖形都可使用,何不考慮朱邦復先生之聚珍碼?
> 
> 中國字由中國人主導當非難事,為與不為而已。

包括我自己在內,我想很多朋友對朱邦復先生一向很欽仰,
但對「聚珍」的架構內容都還不甚清楚。可否請 cms為我們
介紹一下,比如說它是如何處理中文造字內碼不足的問題?
它的中文組字方法為何?是否可與現行的作業系統及應用軟
體交換訊息?

                                        maha 6/27/97
Fri Jun 27 11:40:22 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#6
發信站: glory (bbs.cis.nctu.edu.tw>, 信區: Buddhism)
發信站: glory (Sun Jun 29 08:23:30 1997)
轉信站: Lion!ccnews.nsysu!suncc.ccu!news.csie.nctu!aidebbs!news.yzit!news.ncu!N
來  源: ts1r8.hope.com.tw

In article <33B31340.16ED@tpts1.seed.net.tw> on 27 Jun 1997 03:40:22 GMT 
maha <maha@tpts1.seed.net.tw> wrote:
> 
> cms wrote:
> > 
> > 既然圖形都可使用,何不考慮朱邦復先生之聚珍碼?
> > 
> > 中國字由中國人主導當非難事,為與不為而已。
> 
> 包括我自己在內,我想很多朋友對朱邦復先生一向很欽仰,
> 但對「聚珍」的架構內容都還不甚清楚。可否請 cms為我們
> 介紹一下,比如說它是如何處理中文造字內碼不足的問題?
> 它的中文組字方法為何?是否可與現行的作業系統及應用軟
> 體交換訊息?
> 

朱邦復先生對「聚珍」的核心架構一直秘而不宣,我手上有的只是歷年來從網路上
收集來的,如朱先生的電子書,以及其弟子在 bbs 上的 post。

我想:扛著文化的大纛,再來個三顧茅廬,這樣一來,師出有名,名正而言順,順
天則人應。。。。。。
Sun Jun 29 08:23:30 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#7
wmc
發信站: 國立中山大學網路組 Mailing List (mozart.seed.net.tw , 信區: BudaTech)
cms wrote:
> 
> > 這問題的癥結應是造字空間有限的問題, 而不是廠商不 build-in 的關係.
> > 談得更深點還可能是中文文字本身在電腦上應用的根本問題,
> > 例如中文字也在不斷演化增加, 只要原來的字增減一畫就是一個新字,
> > 目前方言字, 如廣東方言字, 閩南方言字, 中國地大人多方言也多,
> > 將來各地方言字都出來, 恐怕在大的造字空間都不夠;
> > 不若拉丁字由幾個基本字母(character)來組成單字(word), 單字再多
> > 還是由那幾個基本字母組成. 這是根本問題, 除非, 電腦字的顯示設計
> > 從頭來過, 並由中國人主導, 這在可見的未來似乎是不可能的事.
> 
> 既然圖形都可使用,何不考慮朱邦復先生之聚珍碼?
> 
以圖形來秀字已是落伍的技術了, 目前無論是 dos或 windows系統的
字都是以 vector 相關的技術來秀字; 佛典中還用圖形秀字只不過權宜
之計罷了, 主要是為了暫時擺脫目前中文內碼空間不足的困擾; 朱先生
的聚珍約七年前末學曾看過評估過, 之後就只有聽過, 聚珍碼與
圖形秀字有何特點不妨說明看看.

> 中國字由中國人主導當非難事,為與不為而已。
有此豪情壯志令人欽佩, 末學願聞其詳, 也希望出現的不是軟體界的義和團.
建議您從硬體, 軟體, 使用者等的技術, 市場與應用的過去, 現在與未來,
幾個方向來加以說明.
Mon Jun 30 10:22:33 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#8
wmc
發信站: 國立中山大學網路組 Mailing List (mozart.seed.net.tw , 信區: BudaTech)
rancher wrote:
> 
> In article <33B31340.16ED@tpts1.seed.net.tw> on 27 Jun 1997 03:40:22 GMT
> maha <maha@tpts1.seed.net.tw> wrote:
> >
> > cms wrote:
> > >
> > > 既然圖形都可使用,何不考慮朱邦復先生之聚珍碼?
> > >
> > > 中國字由中國人主導當非難事,為與不為而已。
> >
> > 包括我自己在內,我想很多朋友對朱邦復先生一向很欽仰,
> > 但對「聚珍」的架構內容都還不甚清楚。可否請 cms為我們
> > 介紹一下,比如說它是如何處理中文造字內碼不足的問題?
> > 它的中文組字方法為何?是否可與現行的作業系統及應用軟
> > 體交換訊息?
> >
> 
> 朱邦復先生對「聚珍」的核心架構一直秘而不宣,我手上有的只是歷年來從網路上
> 收集來的,如朱先生的電子書,以及其弟子在 bbs 上的 post。
> 
約七年前評估聚珍時, 還須有 keypro 才能使用; 從這點來看朱先生
的市場行銷策略實在不令人茍同, 如果到現在還是秘而不宣的方式,
大概也不會成為被廣泛使用的系統.
Mon Jun 30 10:29:39 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#9
發信站: glory (bbs.cis.nctu.edu.tw>, 信區: Buddhism)
發信站: glory (Tue Jul  1 00:23:42 1997)
轉信站: Lion!ccnews.nsysu!suncc.ccu!news.nctu!news.csie.nctu!news.cis.nctu!news
來  源: b048.dialup.dj.net.tw

In article <33B71C5D.D8F2BFF2@mozart.seed.net.tw> on 30 Jun 1997 
02:29:39 GMT wmc@mozart.seed.net.tw (wmc) wrote:
> 
> > 
> 約七年前評估聚珍時, 還須有 keypro 才能使用; 從這點來看朱先生

能不能聊聊七年前你看到什麼東西?

> 的市場行銷策略實在不令人茍同, 如果到現在還是秘而不宣的方式,
    ︿︿︿︿︿︿
朱沒攪過這玩意吧?他要賺錢從輸入法就可以了。
嗯....免費的 倉頡輸入法 實在不令人茍同 :-)

> 大概也不會成為被廣泛使用的系統.

《系統》..,聚珍是系統嗎?朱好像從未將其系統公諸於世。
Tue Jul 1 00:23:42 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#10
發信站: glory (bbs.cis.nctu.edu.tw>, 信區: Buddhism)
發信站: glory (Tue Jul  1 00:23:41 1997)
轉信站: Lion!ccnews.nsysu!suncc.ccu!news.nctu!news.csie.nctu!news.cis.nctu!news
來  源: b048.dialup.dj.net.tw

In article <33B71AC1.8609D8A0@mozart.seed.net.tw> on 30 Jun 1997 
02:22:33 GMT wmc@mozart.seed.net.tw (wmc) wrote:
> 
> > 
> > 既然圖形都可使用,何不考慮朱邦復先生之聚珍碼?
> > 
> 以圖形來秀字已是落伍的技術了, 目前無論是 dos或 windows系統的
> 字都是以 vector 相關的技術來秀字; 佛典中還用圖形秀字只不過權宜
> 之計罷了, 主要是為了暫時擺脫目前中文內碼空間不足的困擾; 朱先生
> 的聚珍約七年前末學曾看過評估過, 之後就只有聽過, 聚珍碼與
> 圖形秀字有何特點不妨說明看看.
> 

你看過"智慧之旅"麼?

你可知道朱的電子書程式只有一百餘K! 在這極有限的空間,不僅要有簡單的閱
讀功能(pgup/pgdn/up/dn/catalog/last read bookmark),組字及顯示字形的功能
也得通通做在裡面!最奇特的是它並沒有附字型檔!!正確說法是朱根本不用字型
,他把倉頡字根的精神從 input 貫徹到 output,而這些書都是數十
萬乃至上百萬言。
           


你認為這沒什麼嗎?

當然如果你是說 "聚珍" 那個"AP"的話,我也同意是沒什麼。

當你用 "聚珍" 那個"AP"將朱的電子書印到紙上時,看到甚麼?....貨真價實的
向量明體ㄡ!

"聚珍" 那個"AP"幾百 KB 而已,沒什麼。

退回去看看 APPLE ][ 的年代吧,當時所謂漢卡只有 64KB ROM 又要存字型又要
coding 畫出一萬三千多個 15x14 的中文字,難不成是五鬼搬運法?想知道如何辦
到?去問朱某人吧。

其實我心中所想的是如何用聚珍那個一百多K"AP"把全藏 output 出來:在 
printer,在 monitor, 在 dos,在 win95,在 unix,當然──造字難免,但是
健全的碼平面與龐大的空間可免捉襟見肘之苦。

沒錯──撇開自身內建的檢索與處理──如果不能有 DDE/OLE/OCX•••這也只是
"畫"藏經,...嗯...誰能畫出來再說。


我不是義和團,我只是獻曝的野人。
Tue Jul 1 00:23:41 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#11
羅雲•法空
發信站: 獅子吼站 (Lion , 信區: BudaTech)
==> 於  (rancher) 文中述及:
: 你可知道朱的電子書程式只有一百餘K! 在這極有限的空間,不僅要有簡單的閱
: 讀功能(pgup/pgdn/up/dn/catalog/last read bookmark),組字及顯示字形的功能
: 也得通通做在裡面!最奇特的是它並沒有附字型檔!!正確說法是朱根本不用字型
: ,他把倉頡字根的精神從 input 貫徹到 output,而這些書都是數十
: 萬乃至上百萬言。

        當然這樣的能力是經由 dos-asm 作出來的, 若用到 C 以上的話就
        不止如此的 size. 換句話說, 跨平台能力不足以應付網路需要.
--
悲■□■□■□■悲■□■□■□■□■□■□■□■□■□■□■悲■□■□■□■悲
欣  法本法無法 欣  君子之交 其淡如水 執象而求 咫尺千里  欣  今付無法時  欣
交 無法法亦法 交  問余何適 廓爾忘言 華枝春滿 天心月圓  交  法法何曾法  交
集□■□■□■□集□■□■□■□■□■□■□■□■□■□■□集□■□■□■□集
Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 140.117.12.3]
Tue Jul 1 11:48:29 1997
回覆 | 轉寄 | 返回

Re: 回maha有關大辭典新版之
#12
發信站: 國立中山大學網路組 Mailing List (m2.dj.net.tw>, 信區: BudaTech)
rancher wrote:
> 
> In article <33B71C5D.D8F2BFF2@mozart.seed.net.tw> on 30 Jun 1997
> 02:29:39 GMT wmc@mozart.seed.net.tw (wmc) wrote:
> >
> > >
> > 約七年前評估聚珍時, 還須有 keypro 才能使用; 從這點來看朱先生
> 
> 能不能聊聊七年前你看到什麼東西?
> 
一個在 dos run 的系統, 跑出一堆黑白的 windows, 也有中文顯示, 
印象深刻的是如您強調的"速度"很快, 當然也是因為是用 assembly 
coding 的緣故.

> > 的市場行銷策略實在不令人茍同, 如果到現在還是秘而不宣的方式,
>     ︿︿︿︿︿︿
> 朱沒攪過這玩意吧?他要賺錢從輸入法就可以了。
所謂市場行銷簡單說就是把 product 交到 user 的手上使用, 
是不是要賺錢? 這是私人問題, 但總不會是做來自己玩玩, 
或證明自己能力吧? 這總問題最好是朱先生自己回答, 
當然如果您是朱先生發言人, 您也可以代答; 況且末學並未
說朱先生要不要賺錢. 至於他是否能從輸入法"再"賺錢也不
是第三者關心的事.

> 嗯....免費的 倉頡輸入法 實在不令人茍同 :-)
> 
marketing 方式有多種不必定是要免費, 也不必定是付費, 
從佛法來講 :-) 依因緣而定; 如ms 的東東動則要數萬NT$,
但 IE, IIS, FrontPage 等卻是免費, 因緣不同罷了, 
strategy 自然也不同; 倉頡輸入法是否該免費? 
末學沒說過, 但同理也是依因緣而定.
^^^^^^^^^^

記得討論的 focus 應是聚珍與中文big5缺字; 建議一下還是盡量
不要太發散.

> > 大概也不會成為被廣泛使用的系統.
> 
> 《系統》..,聚珍是系統隉H朱好像從未將其系統公諸於世。
這是末學的印象, 畢竟事隔多年了, 如果是記錯了請您不吝指正
; 那麼到底聚珍是甚麼?


-- 
張文明
日月工作室
mailto: dnstudio@m2.dj.net.tw
電子佛教藏經閣: http://w5.dj.net.tw/~DNStudio/canon
Wed Jul 2 11:16:22 1997
回覆 | 轉寄 | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org