看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 1126/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: Heavenchow@Lion (Heaven), 信區: BudaTech
標  題: Re: 檢索測試
發信站: 獅子吼站 (Mon Jan  5 09:21:11 1998)
轉信站: Lion

==> 於 邱大剛 (DavidChiou@Lion) 文中述及:
:     然後再用一個嚴謹的函式,以 ascii 128 等原理,將這
: 50 筆中真正完全符合的給挑出來(或許有 48 筆。)
:     這樣子比起從頭到尾改成中文搜尋來得簡單許多。

和大剛討論後, 大概了解其所謂中文 filter , 的確是不錯的方法.
因為之前的作法, 必需要從頭判斷是否為中文, 也就是每一個字都要
if asc(xx) > 128 then ..... 
這種判斷的確花時間.

若是改成先找到可能是我們要的, 再向前反尋找.
若是在奇數個找到 asc(xx) < 128 的字元, 則剛才找到的為中文字無誤.
若是在偶數個找到, 則此為其它中文的後半字元.

我覺得這方法不錯, 讓大家參考. 至於判別中文字, 有比 > 128 更精確
的方法, 不過我都是這樣用而已. :)

  heaven
--
Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 140.113.87.165]
閱讀文章: 第 1126/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org