看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 1116/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: wiskey@Lion (大 師), 信區: BudaTech 標 題: Re: 補充中文函式 發信站: 獅子吼站 (Wed Dec 31 23:31:07 1997) 轉信站: Lion ==> 於 Heaven (Heavenchow@Lion) 文中述及: : ==> 於 ray (huiray@Lion) 文中述及: : : 有一事要補充一下,辨識一個檔案的第N個byte 是否為 : : 中文,不需要從第一個字元開始,只要從換行碼 #13#10 : : 後的第一個字開始就可以了! : 是的. 因為後學寫的都是從頭找到尾, 故沒提到這點. : 再提供一點, 我常在程式中將 #13 忽略不管, 只處理 #10 : , 這樣就可以一併處理 unix 的檔案了. :) : heaven 辨識一個檔案的第N個字元是否為中文字,亦不需要從換行開始, 只要判斷: 1)該byte是否為big-5之第1 byte? 若是====>則此byte為big-5之第1 byte 若不是==> 讀取前一byte是否為big-5之第1 byte? 若是====> 則第1 項所找到之byte為big-5之第2 byte。 若不是==> 則第1 項所找到之byte為ASCII Code -- Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.4.17] |
閱讀文章: 第 1116/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |