您有新信

 
Re: 中文檢索程式適用性 (fwd)
#1
Post Gateway
發信站: 由 獅子吼站 收信 (ccstudent.ee.ntu.edu.tw , 信區: BudaTech)
以下是單教授的來信:
-----------------------------------------------------
Date: Sat, 9 Nov 1996 11:53:05 +0800
From: Shann Wei-Chang <shann@math.ncu.edu.tw>
Subject: Re: 中文檢索程式適用性導論

> 這個 GAIS 如何呢? 

GAIS == Global Area Information Servers, 目的上與 WWW 上的搜尋工具,
例如 Lycos, Yahoo, Alta Vista 等等相同, 就是要幫助我們很方便地在
網路上找到資料.  其展示品及說明文字都可以在
http://sparc2.cs.ccu.edu.tw/cgais.html
找到.  各位可以去試試看.  我個人的使用經驗是, 用我的中文名字 "單維彰"
做搜尋時, 出來不少東西, 但是好像沒有直接跟我相關的.  而用英文 "Wei-Chang"
或是 "Shann" 來搜尋時, 都找不到我, 但可以找到我的幾個朋友 (一位在台大
資訊系, 一位在交大資工).  不曉得是不是他們的 server 還沒有把中央大學
數學系的 WWW pages 放在資料庫裡?

但是當我用 DEC 的 Alta Vista 搜尋我的名字時, 都可以找到我所有的 HTML
documents.  有趣的是, 如果我用大五碼輸入, 則 Alta Vista 除了找到我的
中文名字之外, 還找到很多恰好字碼相同的日文, 韓文, 阿拉伯文之類的
文件.  可惜我讀不懂, 否則, 知道 "單維彰" 三個字的碼在別的語文中的
對應文字, 應該是很有趣的.

> 要錢嗎?

要不要錢, 賣不賣, 應該要向中正大學打聽.  但因為這 GAIS 是向國科會領補助
的研究計劃, 至少有一部分應該是公共財產才對吧.

我個人覺得他們最有趣的新想法是, 中國字的同音搜尋.  這對打字常發生同音
別字的人是個福音.

在佛教團體目前的應用範圍內, 我們應該只需要 GAIS 的核心部分, 也就是
製造 index 的部分和 indexed text searching 的部分.  它們做的網路部分,
目前好像還不需要.  其實, 像是 DEC 的 Alta Vista 這種東西, 必定可以
搜尋到我們的 WWW 站.  比如說大剛的烘培雞裡面的佛教文獻, 就應該可以從
Alta Vista 裡面搜尋得到.  問題只是, Alta Vista 是全球性的, 所以必然比較
慢, 而且會出現字碼恰好相合的其他國文字, 造成干擾.  再者, 那個 search
engine 必不會特別照顧中國字的某些特性.  這些都是我們期望像 GAIS 這種
計劃能夠改良的地方.  如果不能在這兩個方向上改良, 那麼就直接用國外的
search engine 就好了.  我想中正的 search engine 應該會特別照顧中國字
的特性吧, 他們連同音字搜尋都想得到, 其他的應該也想到了.

只是, 效果如何, 其他人如何使用, 現在還難說.

Alta Vista 在 http://www.altavista.digital.com/

-Shann
Fri Nov 15 11:49:03 1996
回覆 | 轉寄 | 返回

Re: 中文檢索程式適用性 (fwd)
#2
Post Gateway
發信站: 由 獅子吼站 收信 (ccstudent.ee.ntu.edu.tw , 信區: BudaTech)
---------- Forwarded message ----------
Date: Fri, 08 Nov 1996 15:52:49 +0800
From: Shwu-meei Chiou <smchiou@ccms.ntu.edu.tw>
To: alice@cctwin.ee.ntu.edu.tw, b83050@cctwin.ee.ntu.edu.tw,
    b3502118@cctwin.ee.ntu.edu.tw, b4502011@cctwin.ee.ntu.edu.tw,
    b83107@cctwin.ee.ntu.edu.tw, b84018@cctwin.ee.ntu.edu.tw,
    b84021@cctwin.ee.ntu.edu.tw
Subject: Re: 中文檢索程式適用性

David Chiou wrote:

> 3. 利用編碼過的全文檢索:

	以下是 中正大學 吳昇教授 所發展的檢索系統之摘要,謹供參考。

Title: TANet 資源發掘系統-BBS精華與 FAQ文件蒐集整理與檢索

隨著台灣學術網路的日易普及﹐目前在TANet上﹐可共享之資訊資源相當鉅量﹐
有數以千百計的資訊供應站﹐諸如 anonymous ftp sites﹐gopher servers﹐
WWW servers等等﹐而且正以飛快的速度繼續增加中。
面對如此浩瀚如海的資訊空間﹐如何容易地、有效率地找到所需或有興趣的資訊
乃是基本之重要課題。它關鍵到是否整個 TANet 社會能夠有效率的利用到這些
寶貴的資訊資源。
在本計畫堙M我們針對台灣學術網路上各站之中文BBS精華區與FAQ文件等資料
予以蒐集、整理並利用GAIS檢索系統來建立此類資訊檢索系統。此系統將提供
以下特色:
a)  功能強大的查詢﹐諸如:容錯搜尋、中文同音搜尋、隨意之Boolean搜尋、
    結構查詢或全文搜尋等﹐與使用者自定比對範圍等。
b)  超媒體、易使用的使用者介面, 與使用者可控制之顯示格式。



regards,
Shwu-meei Chiou (邱淑美)

mailto:smchiou@ccms.ntu.edu.tw
Fri Nov 15 11:49:16 1996
回覆 | 轉寄 | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org