看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 185/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: b83050@ccstudent.ee.ntu.edu.tw (Post Gateway), 信區: BudaTech 標 題: Re: cgrep 2 (fwd) 發信站: 由 獅子吼站 收信 (Mon Aug 12 14:51:48 1996) 以下是單教授的回信: ---------- Forwarded message ---------- Date: Mon, 12 Aug 1996 21:08:20 +0800 From: Shann Wei-Chang <shann@math.ncu.edu.tw> Subject: Re: cgrep 2 > 您說的中正大學弄的是什麼軟體? 如果是指全文檢索的話, > 那基本上和 cgrep或類似的 grep 應該是不太一樣的。 我猜大剛說的是中正資工的中文全文檢索軟體. 中研院也曾有過這樣的研究, 但我不知道中研院的成果是否可以自由取得. 中正的成果在 WWW 上有公開, 但是似乎還沒結案, 所以也沒有最後定稿的版本. 其實中央資管在兩年前也作 了這樣的研究, 他們是把 public domain 的 wais 程式給中文化了, 稱作 cwais. 但是在其主事的研究生畢業後, 我就不知道下文了. 我們的 cgrep (或 tgrep) 不是全文檢索. 我們不是事先把將要被查詢的文章 做一套檢索表, 然後依照此表格來加快搜尋的時間. *grep 程式是打硬功, 靠蠻力 的. 它是把要搜尋的檔案打開, 一個字一個字地讀, 然後比對字串. 我認為, 設計一個為中文文字檔案量身訂作的 grep 程式, 是設計一個中文全文檢索 系統的必備經驗. 所以我們做了. 我們未必做得比較好, 但純粹出於興趣, 我們 喜歡寫程式. -Shann |
閱讀文章: 第 185/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |