看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 185/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: b83050@ccstudent.ee.ntu.edu.tw (Post Gateway), 信區: BudaTech
標  題: Re: cgrep 2 (fwd)
發信站: 由 獅子吼站 收信 (Mon Aug 12 14:51:48 1996)


以下是單教授的回信:

---------- Forwarded message ----------
Date: Mon, 12 Aug 1996 21:08:20 +0800
From: Shann Wei-Chang <shann@math.ncu.edu.tw>
Subject: Re: cgrep 2

> 您說的中正大學弄的是什麼軟體? 如果是指全文檢索的話,
> 那基本上和 cgrep或類似的 grep 應該是不太一樣的。

我猜大剛說的是中正資工的中文全文檢索軟體.  中研院也曾有過這樣的研究,
但我不知道中研院的成果是否可以自由取得.  中正的成果在 WWW 上有公開,
但是似乎還沒結案, 所以也沒有最後定稿的版本.  其實中央資管在兩年前也作
了這樣的研究, 他們是把 public domain 的 wais 程式給中文化了, 稱作 cwais.
但是在其主事的研究生畢業後, 我就不知道下文了.

我們的 cgrep (或 tgrep) 不是全文檢索.  我們不是事先把將要被查詢的文章
做一套檢索表, 然後依照此表格來加快搜尋的時間.  *grep 程式是打硬功, 靠蠻力
的.  它是把要搜尋的檔案打開, 一個字一個字地讀, 然後比對字串.

我認為, 設計一個為中文文字檔案量身訂作的 grep 程式, 是設計一個中文全文檢索
系統的必備經驗.  所以我們做了.  我們未必做得比較好, 但純粹出於興趣, 我們
喜歡寫程式.

-Shann

閱讀文章: 第 185/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org