---------- Forwarded message ----------
Date: Mon, 12 Aug 1996 21:08:20 +0800
From: Shann Wei-Chang <shann@math.ncu.edu.tw>
Subject: Re: cgrep 2
> 您說的中正大學弄的是什麼軟體? 如果是指全文檢索的話,
> 那基本上和 cgrep或類似的 grep 應該是不太一樣的。
我猜大剛說的是中正資工的中文全文檢索軟體. 中研院也曾有過這樣的研究,
但我不知道中研院的成果是否可以自由取得. 中正的成果在 WWW 上有公開,
但是似乎還沒結案, 所以也沒有最後定稿的版本. 其實中央資管在兩年前也作
了這樣的研究, 他們是把 public domain 的 wais 程式給中文化了, 稱作 cwais.
但是在其主事的研究生畢業後, 我就不知道下文了.
我們的 cgrep (或 tgrep) 不是全文檢索. 我們不是事先把將要被查詢的文章
做一套檢索表, 然後依照此表格來加快搜尋的時間. *grep 程式是打硬功, 靠蠻力
的. 它是把要搜尋的檔案打開, 一個字一個字地讀, 然後比對字串.
我認為, 設計一個為中文文字檔案量身訂作的 grep 程式, 是設計一個中文全文檢索
系統的必備經驗. 所以我們做了. 我們未必做得比較好, 但純粹出於興趣, 我們
喜歡寫程式.
-Shann