看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 228/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: wiskey@ms10.hinet.net (Post Gateway), 信區: BudaTech 標 題: [無主題] 發信站: 由 獅子吼站 收信 (Sun Oct 13 15:36:04 1996) >想必您正創作此一軟體中....阿彌陀佛! >建議功能: >表列佛經選單 ( 並可自由新增佛經 ) >由作者(譯者)、經書名稱、分類(比方說:一般課誦、往生課誦、密宗心法、....) >都能查詢經書名稱及內容 >全文檢索 (那一部或那幾部經書提過 "某字串" 可由"某字串"查出 並立即原文顯示 >最好有注音(方法請您規劃)因為佛經很多讀音較常用法不同 >如能結合語音或多媒體系統自動發音或課誦就更完美了! >阿彌陀佛! 謹代表我佛弟子先感謝您了! > > 釋智信 (ASSEM) 信和尚道次: 向所建言已知悉! 茲回答如下,並於此同時週知有意眾生: 一、書 目 處 理 :該軟體收經時,是以”藏”為單位,所以該xx藏(例大正藏) 內之所有經典名稱將一體通收入選單目錄內,不論所收之經典 (表列佛經 是否已入藏(但會另行標示該經典是否已入藏)所以經名是可 選單) 以檢索而得。 又,同時也有新增、刪除、修改等之基本功能。 二、繪 圖 處 理 :在出文字時同時出注音之技術,可以實作出來。但,麻煩的是 (注 音) 目前之注音都是各別分開的,如ㄈㄣ ㄎㄞ ㄉ,要打出合在一 起之上下形,須先作TTF 規格之規劃,才能再將字形特徵load 上去(這涉及到字形之放大縮小功能),由於這部分是瑣碎長 時的工夫,所以二版以後才打算實作。不過,單一字注音之功 能會較快出來。實作中凡有字之音唸不出時,原則以康熙字典 之切韻為準。 三、語音與多媒體:語音的功能可以實作出來,其中關鍵處計分-- 1)純語音檔放出功能--這部分可以實作,可用在誦唱佛經之上 ,但須事前即已錄好語音檔才可。 2)出字發音(Text To Speech)--這部份定義在「出字發音」上 ,其中有兩種作法-- 1>方法同上,整部佛經事前即須以語音檔方式存檔,要聽時 再放出,這方法優點是語音連貫自然,缺點是非常佔記憶 體,以每秒4k的取樣率,就可算出所耗的記憶體了。在實 作上,可以MIDI的規格做出,配合語音,文字可依序出現 在螢幕上,就如KTV 、卡拉OK之功能一般。 2>先錄基本單字語音檔;在發音時隨文字播放,但這不是輕 易就能做的!其中涉及發音人之咬字問題,須有人發心出 資請專業的廣播人來發音錄檔才可。技術上則同上,可以 實作出來。 3)多媒體方面--則就須視是否尚有餘力而定!由於多媒體所涉 及之技術較複雜,尤其是動畫與音效的配合方 面。如果只是單純放影片而已,這功能也可以 實作。 四、索 引 部 分 :計規劃有目錄檢索、內文檢索及全文檢索三種 1)目錄檢索--即上述第一項功能;而作者...等之功能亦有,只是所提出事項 仍不夠詳細,未來將隨作隨改。 2)內文檢索--搜尋一檔內所給定之字串或所指定數檔中之內文。 3)全文檢索--做這個功能是一個大學問!實在很難用三言兩語說得清楚!但 目前所規劃之規格,已能做出所建議的功能! 不過,單只其中的一個「全文檢索表」即已佔1.2GM 左右,此 中尚且未包括「目錄檢索表」等其他各種對照表格!這實在太 傷記憶體! 之所以大吃記憶體之原因是:本軟體預計要讀的內碼太多(內 碼預計可讀Big5,JIS,KSC,CNS 11643,UNICode,ISO 10646, UNICode,差不多市面上所有的碼都收了進來),以及欲迅速的 檢索字串,因此所導致的檢索表內容過於龐大之故(主要原因 )!所以,也曾想過以市面套裝之Database Server 來取代, 但考慮使用者所能負擔之費用故,也放棄了這個想法!最後, 仍然還是決定老牛伏驥--還是自己來寫。 五、軟 體 規 劃 因於檢索而衍生的一些其他影響之故,目前為便利軟體能真正地實際被使用, 於是再次修正並規劃該軟體之新方向,謹此順緣大略介紹一下: 1)擬將軟體分為單機版與Client/Server版。 2)單機版之概況為-- 1>操 作 系 統 :初步建立在MS Windows95 之上,未來再視狀況支援其他OS。 2>內 碼 系 統 -- ヾ初 版 :收Big5內碼與市面資料檔案相容,收EUNI(expanded UNICode)交換碼 (由筆者自行制定之四碼規格,字集量目前規劃可收約CCCII+ 128^3) , 以便與未來之各類內碼交換。 ゝ再 版 :視使用者之反應再作調整。但原則以收CCCII Code以與國家圖書館現 用之內碼相容;收UNICode 以與使用32位元系統之檔案相容。 3>網 路 系 統 :可作E-Mail 、語音之收發,視狀況再決定是否做BBS之「終端 模擬」功能。 4>資料庫系統 -- 1.全文檢索功能:可找出所有大藏經內的所有字辭(辭句有長度限制!若不限 制,以採內文檢索方式,那可要找個一天一夜了!),設檢 索表之檢索技術若無法有效突破,則預計要作壓縮處理,以 減少所佔記憶體。 2.機讀編目功能:採用國家圖書館之規格,以用於圖書管理,及與國家圖書館 檔案管理系統一致,以便未來與之網路溝通或讀檔相容用。 3.檔案格式與存取語法 -- a)存檔格式:檔案格式除檔頭有特殊標示外,餘皆以一般text檔存檔,使用 者若為節省硬碟空間可利用系統所提供之工具先行作硬碟壓縮 工作。 b)存取方式:a.當檔案自外讀入記憶體時,一律以EUNI 碼讀入。 b.當檔案傳出電腦,或存入軟碟時,檔頭若無標示時,內定以 big5傳出。 c.當檔案存入硬碟時,檔頭若無標示,內定以EUNI碼存檔。 c)網路支援:為支援網路之功能,檔案經轉檔後可以HTML格式存檔。 所以,只有傳出時是Big5,其他一律以EUNI碼運作。雖然內部處理時較 複雜,但為了與市面上所有碼相容(如ASCII、Big5、CCCII、CNS 11643 、 UNICode及ISO 10646 碼),亦不得不如此。 另,為增快索引之速度,將不擬作任何語法制定索求,直接程式內部控制。 4.資料庫規模:初版建立在單機多工作業系統之下,不作Client/Server 功能 。但,若Client/Server 版不作時,則會在再版時加入區域網 路,廣域網路之SQL 語法功能,以供一般圖書館管理用。 5.特 殊 功 能 -- a)擬提供HTML之檔案編輯功能。 b)轉碼功能:由於相容性之考慮之故,可能須常作讀寫之轉碼工作,此故, 提供轉碼功能。 c)外掛元件功能:擬提供類似windows之檔案管理員功能表可外掛元件的方式 。使用者未來可依該軟體說明書指示設計所需功能元件,外 掛入該軟體。 d)其他功能細節:由於筆者無法預測檢索時的微細需求,所以,其他的一些 使用上之細節功能則須由使用者提示才知道。 6.其 他 功 能 :初版時以檢索與編輯功能為優先,其他一些基本功能也將具有 ,不過是何類及何時出來則將視其需求性而定,這些功能計有 語音、影片、傳輸、列印、繪圖、掃瞄(OCR)等。 7.版 權 問 題 :相信此問題遲早將有人相問,在此一併告知! 若是軟體果然完成,則須視此軟體是否需要永續維修而定收費 標準,筆者大事未了,大概是無法一直維護之!若有人維修, 則原則以收若干工本費+維修人員生活費=大約NT.400元左右 吧! 若是無意永續之,則大約只收工本費 NT.100∼200元左右 ( 含大藏經及一些光碟片),未來則不放在心上,本無來去,就 隨緣吧! 3)Client/Server版 -- Client/Server 版與單機版最大的差別是有較完整的資料庫系統,所以所用之系統, 將不限制一定是筆者自己所設計之規格,也許用MS SQL Server 或 Informix等軟體 亦不一定,目前尚未定案。 以上所述即是近年所規劃從事的概況! 耑此 敬祝 法喜充滿! 楊 毅(wiskey) 合十 10/08/'96 PS: 1)wiskey: wiskey isn't whiskey ! it means: almost half of buddha's wisdom but had got the key can in. and the way could make everyone drunk like a liquor whiskey ! 2)如果,有其他使用者想告知所欲之新功能,可將訊息寄來 wiskey@ms10.hinet.net( 較佳 ) 或在「台大椰林之"生活佛教板"」上發表 (telnet ->open bbs.ntu.edu.tw) |
閱讀文章: 第 228/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |