看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 1126/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: Heavenchow@Lion (Heaven), 信區: BudaTech 標 題: Re: 檢索測試 發信站: 獅子吼站 (Mon Jan 5 09:21:11 1998) 轉信站: Lion ==> 於 邱大剛 (DavidChiou@Lion) 文中述及: : 然後再用一個嚴謹的函式,以 ascii 128 等原理,將這 : 50 筆中真正完全符合的給挑出來(或許有 48 筆。) : 這樣子比起從頭到尾改成中文搜尋來得簡單許多。 和大剛討論後, 大概了解其所謂中文 filter , 的確是不錯的方法. 因為之前的作法, 必需要從頭判斷是否為中文, 也就是每一個字都要 if asc(xx) > 128 then ..... 這種判斷的確花時間. 若是改成先找到可能是我們要的, 再向前反尋找. 若是在奇數個找到 asc(xx) < 128 的字元, 則剛才找到的為中文字無誤. 若是在偶數個找到, 則此為其它中文的後半字元. 我覺得這方法不錯, 讓大家參考. 至於判別中文字, 有比 > 128 更精確 的方法, 不過我都是這樣用而已. :) heaven -- Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 140.113.87.165] |
閱讀文章: 第 1126/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |