看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 228/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: wiskey@ms10.hinet.net (Post Gateway), 信區: BudaTech
標  題: [無主題]
發信站: 由 獅子吼站 收信 (Sun Oct 13 15:36:04 1996)


 
>想必您正創作此一軟體中....阿彌陀佛!
>建議功能:
>表列佛經選單 ( 並可自由新增佛經 )
>由作者(譯者)、經書名稱、分類(比方說:一般課誦、往生課誦、密宗心法、....)
>都能查詢經書名稱及內容
>全文檢索 (那一部或那幾部經書提過 "某字串" 可由"某字串"查出 並立即原文顯示
>最好有注音(方法請您規劃)因為佛經很多讀音較常用法不同
>如能結合語音或多媒體系統自動發音或課誦就更完美了!
>阿彌陀佛! 謹代表我佛弟子先感謝您了!
>
>                                 釋智信 (ASSEM)


信和尚道次:

    向所建言已知悉! 茲回答如下,並於此同時週知有意眾生:

一、書 目 處 理 :該軟體收經時,是以”藏”為單位,所以該xx藏(例大正藏)
                  內之所有經典名稱將一體通收入選單目錄內,不論所收之經典
    (表列佛經    是否已入藏(但會另行標示該經典是否已入藏)所以經名是可
      選單)      以檢索而得。
         又,同時也有新增、刪除、修改等之基本功能。

二、繪 圖 處 理 :在出文字時同時出注音之技術,可以實作出來。但,麻煩的是
  (注 音)    目前之注音都是各別分開的,如ㄈㄣ ㄎㄞ ㄉ,要打出合在一
                  起之上下形,須先作TTF 規格之規劃,才能再將字形特徵load
                  上去(這涉及到字形之放大縮小功能),由於這部分是瑣碎長
                  時的工夫,所以二版以後才打算實作。不過,單一字注音之功
                  能會較快出來。實作中凡有字之音唸不出時,原則以康熙字典
                  之切韻為準。 

三、語音與多媒體:語音的功能可以實作出來,其中關鍵處計分--
                  1)純語音檔放出功能--這部分可以實作,可用在誦唱佛經之上
                                     ,但須事前即已錄好語音檔才可。

                  2)出字發音(Text To Speech)--這部份定義在「出字發音」上
                                              ,其中有兩種作法--
                    1>方法同上,整部佛經事前即須以語音檔方式存檔,要聽時
                      再放出,這方法優點是語音連貫自然,缺點是非常佔記憶
                      體,以每秒4k的取樣率,就可算出所耗的記憶體了。在實
                      作上,可以MIDI的規格做出,配合語音,文字可依序出現
                      在螢幕上,就如KTV 、卡拉OK之功能一般。
                   
                    2>先錄基本單字語音檔;在發音時隨文字播放,但這不是輕
                      易就能做的!其中涉及發音人之咬字問題,須有人發心出
                      資請專業的廣播人來發音錄檔才可。技術上則同上,可以
                      實作出來。
                    
                  3)多媒體方面--則就須視是否尚有餘力而定!由於多媒體所涉
                         及之技術較複雜,尤其是動畫與音效的配合方
                                面。如果只是單純放影片而已,這功能也可以
                                實作。

四、索 引 部 分 :計規劃有目錄檢索、內文檢索及全文檢索三種

  1)目錄檢索--即上述第一項功能;而作者...等之功能亦有,只是所提出事項
         仍不夠詳細,未來將隨作隨改。

    2)內文檢索--搜尋一檔內所給定之字串或所指定數檔中之內文。

    3)全文檢索--做這個功能是一個大學問!實在很難用三言兩語說得清楚!但
                  目前所規劃之規格,已能做出所建議的功能!
           不過,單只其中的一個「全文檢索表」即已佔1.2GM 左右,此
                  中尚且未包括「目錄檢索表」等其他各種對照表格!這實在太
                  傷記憶體! 
         之所以大吃記憶體之原因是:本軟體預計要讀的內碼太多(內
                  碼預計可讀Big5,JIS,KSC,CNS 11643,UNICode,ISO 10646,
                  UNICode,差不多市面上所有的碼都收了進來),以及欲迅速的    
                  檢索字串,因此所導致的檢索表內容過於龐大之故(主要原因
                  )!所以,也曾想過以市面套裝之Database Server 來取代,
         但考慮使用者所能負擔之費用故,也放棄了這個想法!最後,
         仍然還是決定老牛伏驥--還是自己來寫。

五、軟 體 規 劃

    因於檢索而衍生的一些其他影響之故,目前為便利軟體能真正地實際被使用,
    於是再次修正並規劃該軟體之新方向,謹此順緣大略介紹一下:

1)擬將軟體分為單機版與Client/Server版。

2)單機版之概況為--

  1>操 作 系 統 :初步建立在MS Windows95 之上,未來再視狀況支援其他OS。

  2>內 碼 系 統 --
  ヾ初 版 :收Big5內碼與市面資料檔案相容,收EUNI(expanded UNICode)交換碼
           (由筆者自行制定之四碼規格,字集量目前規劃可收約CCCII+ 128^3)
            , 以便與未來之各類內碼交換。
  ゝ再 版 :視使用者之反應再作調整。但原則以收CCCII Code以與國家圖書館現
            用之內碼相容;收UNICode 以與使用32位元系統之檔案相容。

  3>網 路 系 統 :可作E-Mail 、語音之收發,視狀況再決定是否做BBS之「終端
         模擬」功能。

  4>資料庫系統  --

    1.全文檢索功能:可找出所有大藏經內的所有字辭(辭句有長度限制!若不限
          制,以採內文檢索方式,那可要找個一天一夜了!),設檢
           索表之檢索技術若無法有效突破,則預計要作壓縮處理,以
          減少所佔記憶體。

    2.機讀編目功能:採用國家圖書館之規格,以用於圖書管理,及與國家圖書館
                    檔案管理系統一致,以便未來與之網路溝通或讀檔相容用。

    3.檔案格式與存取語法 --
      a)存檔格式:檔案格式除檔頭有特殊標示外,餘皆以一般text檔存檔,使用
         者若為節省硬碟空間可利用系統所提供之工具先行作硬碟壓縮
         工作。

      b)存取方式:a.當檔案自外讀入記憶體時,一律以EUNI 碼讀入。
                  b.當檔案傳出電腦,或存入軟碟時,檔頭若無標示時,內定以
                    big5傳出。
                  c.當檔案存入硬碟時,檔頭若無標示,內定以EUNI碼存檔。

      c)網路支援:為支援網路之功能,檔案經轉檔後可以HTML格式存檔。
      

          所以,只有傳出時是Big5,其他一律以EUNI碼運作。雖然內部處理時較
      複雜,但為了與市面上所有碼相容(如ASCII、Big5、CCCII、CNS 11643 、
      UNICode及ISO 10646 碼),亦不得不如此。
      另,為增快索引之速度,將不擬作任何語法制定索求,直接程式內部控制。


    4.資料庫規模:初版建立在單機多工作業系統之下,不作Client/Server 功能
         。但,若Client/Server 版不作時,則會在再版時加入區域網
         路,廣域網路之SQL 語法功能,以供一般圖書館管理用。

    5.特 殊 功 能 --
      a)擬提供HTML之檔案編輯功能。

      b)轉碼功能:由於相容性之考慮之故,可能須常作讀寫之轉碼工作,此故,
                  提供轉碼功能。

      c)外掛元件功能:擬提供類似windows之檔案管理員功能表可外掛元件的方式
                     。使用者未來可依該軟體說明書指示設計所需功能元件,外
                      掛入該軟體。

      d)其他功能細節:由於筆者無法預測檢索時的微細需求,所以,其他的一些
           使用上之細節功能則須由使用者提示才知道。


    6.其 他 功 能 :初版時以檢索與編輯功能為優先,其他一些基本功能也將具有
          ,不過是何類及何時出來則將視其需求性而定,這些功能計有
          語音、影片、傳輸、列印、繪圖、掃瞄(OCR)等。


    7.版 權 問 題 :相信此問題遲早將有人相問,在此一併告知!
             若是軟體果然完成,則須視此軟體是否需要永續維修而定收費
          標準,筆者大事未了,大概是無法一直維護之!若有人維修,
          則原則以收若干工本費+維修人員生活費=大約NT.400元左右
          吧!
          若是無意永續之,則大約只收工本費 NT.100∼200元左右 (
          含大藏經及一些光碟片),未來則不放在心上,本無來去,就
          隨緣吧!


3)Client/Server版 --

 Client/Server 版與單機版最大的差別是有較完整的資料庫系統,所以所用之系統,
  將不限制一定是筆者自己所設計之規格,也許用MS SQL Server 或 Informix等軟體
  亦不一定,目前尚未定案。


  以上所述即是近年所規劃從事的概況! 耑此

 敬祝  法喜充滿!


                                         楊 毅(wiskey) 合十 10/08/'96



PS: 1)wiskey: wiskey isn't whiskey ! it means:
              almost half of buddha's wisdom but had got the key can in.
              and
              the way could make everyone drunk like a liquor whiskey !

    2)如果,有其他使用者想告知所欲之新功能,可將訊息寄來
      wiskey@ms10.hinet.net( 較佳 )
      或在「台大椰林之"生活佛教板"」上發表 (telnet ->open bbs.ntu.edu.tw)








閱讀文章: 第 228/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org