看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 271/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: b83050@ccstudent.ee.ntu.edu.tw (Post Gateway), 信區: BudaTech 標 題: Re: 中文檢索程式適用性 (fwd) 發信站: 由 獅子吼站 收信 (Fri Nov 15 11:49:03 1996) 以下是單教授的來信: ----------------------------------------------------- Date: Sat, 9 Nov 1996 11:53:05 +0800 From: Shann Wei-Chang <shann@math.ncu.edu.tw> Subject: Re: 中文檢索程式適用性導論 > 這個 GAIS 如何呢? GAIS == Global Area Information Servers, 目的上與 WWW 上的搜尋工具, 例如 Lycos, Yahoo, Alta Vista 等等相同, 就是要幫助我們很方便地在 網路上找到資料. 其展示品及說明文字都可以在 http://sparc2.cs.ccu.edu.tw/cgais.html 找到. 各位可以去試試看. 我個人的使用經驗是, 用我的中文名字 "單維彰" 做搜尋時, 出來不少東西, 但是好像沒有直接跟我相關的. 而用英文 "Wei-Chang" 或是 "Shann" 來搜尋時, 都找不到我, 但可以找到我的幾個朋友 (一位在台大 資訊系, 一位在交大資工). 不曉得是不是他們的 server 還沒有把中央大學 數學系的 WWW pages 放在資料庫裡? 但是當我用 DEC 的 Alta Vista 搜尋我的名字時, 都可以找到我所有的 HTML documents. 有趣的是, 如果我用大五碼輸入, 則 Alta Vista 除了找到我的 中文名字之外, 還找到很多恰好字碼相同的日文, 韓文, 阿拉伯文之類的 文件. 可惜我讀不懂, 否則, 知道 "單維彰" 三個字的碼在別的語文中的 對應文字, 應該是很有趣的. > 要錢嗎? 要不要錢, 賣不賣, 應該要向中正大學打聽. 但因為這 GAIS 是向國科會領補助 的研究計劃, 至少有一部分應該是公共財產才對吧. 我個人覺得他們最有趣的新想法是, 中國字的同音搜尋. 這對打字常發生同音 別字的人是個福音. 在佛教團體目前的應用範圍內, 我們應該只需要 GAIS 的核心部分, 也就是 製造 index 的部分和 indexed text searching 的部分. 它們做的網路部分, 目前好像還不需要. 其實, 像是 DEC 的 Alta Vista 這種東西, 必定可以 搜尋到我們的 WWW 站. 比如說大剛的烘培雞裡面的佛教文獻, 就應該可以從 Alta Vista 裡面搜尋得到. 問題只是, Alta Vista 是全球性的, 所以必然比較 慢, 而且會出現字碼恰好相合的其他國文字, 造成干擾. 再者, 那個 search engine 必不會特別照顧中國字的某些特性. 這些都是我們期望像 GAIS 這種 計劃能夠改良的地方. 如果不能在這兩個方向上改良, 那麼就直接用國外的 search engine 就好了. 我想中正的 search engine 應該會特別照顧中國字 的特性吧, 他們連同音字搜尋都想得到, 其他的應該也想到了. 只是, 效果如何, 其他人如何使用, 現在還難說. Alta Vista 在 http://www.altavista.digital.com/ -Shann |
閱讀文章: 第 271/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |