您有新信

 
補充中文函式
#1
ray
發信站: 獅子吼站 (Lion , 信區: BudaTech)
有一事要補充一下,辨識一個檔案的第N個byte 是否為
中文,不需要從第一個字元開始,只要從換行碼 #13#10
後的第一個字開始就可以了!

研發部
Sun Dec 28 11:46:38 1997
回覆 | 轉寄 | 返回

Re: 補充中文函式
#2
Heaven
發信站: 獅子吼站 (Lion , 信區: BudaTech)
==> 於 ray (huiray@Lion) 文中述及:
: 有一事要補充一下,辨識一個檔案的第N個byte 是否為
: 中文,不需要從第一個字元開始,只要從換行碼 #13#10
: 後的第一個字開始就可以了!

  是的. 因為後學寫的都是從頭找到尾, 故沒提到這點.
  再提供一點, 我常在程式中將 #13 忽略不管, 只處理 #10
  , 這樣就可以一併處理 unix 的檔案了. :)

  heaven
Tue Dec 30 16:17:32 1997
回覆 | 轉寄 | 返回

Re: 補充中文函式
#3
大 師
發信站: 獅子吼站 (Lion , 信區: BudaTech)
==> 於 Heaven (Heavenchow@Lion) 文中述及:
: ==> 於 ray (huiray@Lion) 文中述及:
: : 有一事要補充一下,辨識一個檔案的第N個byte 是否為
: : 中文,不需要從第一個字元開始,只要從換行碼 #13#10
: : 後的第一個字開始就可以了!
:   是的. 因為後學寫的都是從頭找到尾, 故沒提到這點.
:   再提供一點, 我常在程式中將 #13 忽略不管, 只處理 #10
:   , 這樣就可以一併處理 unix 的檔案了. :)
:   heaven


   辨識一個檔案的第N個字元是否為中文字,亦不需要從換行開始,
   只要判斷:
 1)該byte是否為big-5之第1 byte? 
   若是====>則此byte為big-5之第1 byte
   若不是==>
       讀取前一byte是否為big-5之第1 byte?
       若是====> 則第1 項所找到之byte為big-5之第2 byte。
       若不是==> 則第1 項所找到之byte為ASCII Code
Wed Dec 31 23:31:07 1997
回覆 | 轉寄 | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org