unicode,統一碼,可包含世界上所有國家的字元,每乙個字元用兩個位元組表示!
utf-16, 基本上就是unicode雙位元組編碼方式的實現,再加上乙個未來擴充套件需求的編碼機制
utf-8,unicode的不等幅編碼機制,英文保持不變,其他用兩個或三個位元組表示,如中文用三個位元組表示
ucs-2,大體上可考慮成utf-16,
ucs-4, 用4個位元組表示,在utf-16編碼前面加上兩個空白的bytes,
utf-8 編碼原理參看附圖:
utf-16 的擴充套件機制(**對):
保留編碼範圍:d800 ----dbff(高部)
dc00 ---dfff(底部)
兩部分組合用來表示乙個字元共可表示1024*1024個字元
私有區:
共三塊私有區:
e000 ----------------f8ff
**對私有區:
f0000 --------------ffffd
100000 ------------10fffd
字元編碼 unicode編碼
1.ascii american standard code for information interchange 美國資訊交換標準 這是計算機上最早使用的通用的編碼方案。那個時候計算機還只是拉丁文本的專利,根本沒有想到現在計算機的發展勢頭,如果想到了,可能一開始就會使用unicode了。當時絕大...
雜記 Unicode字符集
unicode是字符集,但是微軟在windows上把unicode視為utf 16,即乙個字元佔2個位元組16位。utf 16是unicode的一種編碼規則,與此同時還有utf 8 utf 32。utf 8將一些字元編碼為1個位元組,一些字元編碼為2個位元組,一些字元編碼為3個位元組,一些字元編碼為...
UNICODE編碼問題
unicode編碼問題 今天在eclipse裡面看jode jad class反編譯出來的 發現漢字都用unicode標示,理解起來非常不方便,例如 u65b0 u95fb u680f u76ee u8bbe u7f6e 就是漢字 新聞欄目設定 為了察看方便,特寫一段vb 來快速轉換 public ...