**點
unicode標準的本意很簡單:希望給世界上每一種文字系統的每乙個字元,都分配乙個唯一的整數,這些整數叫做**點(code points)。
**空間
所有的**點構成乙個**空間(code space),根據unicode定義,總共有1,114,112個**點,編號從0x0到0x10ffff。換句話說,如果每個**點都能夠代表乙個有效字元的話,unicode標準最多能夠編碼1,114,112,也就是大概110多萬個字元。最新的unicode標準(7.0)已經給超過11萬個字元分配了**點。
**平面
unicode標準把**點分成了17個**平面(code plane),編號為#0到#16。
每個**平面包含65,536(2^16)個**點(17*65,536=1,114,112)。
其中,plane#0叫做基本多語言平面(basic multilingual plane,bmp),其餘平面叫做補充平面(supplementary planes)。
unicode7.0只使用了17個平面中的6個,並且給這6個平面起了名字,如下
public string getchinesebyunicode(string sunicode)}} else
}return outbuffer.tostring();
}
中文 unicode互轉
中文,unicode互轉。網上有些只有一種轉換,有些有問題。自己測試無問題,主要用於解決odb資料庫問題。將中文轉化為unicode碼 public static string gbk2unicode string str return result.tostring public static b...
中文 unicode互轉
中文,unicode互轉。網上有些只有一種轉換,有些有問題。自己測試無問題,主要用於解決odb資料庫問題。將中文轉化為unicode碼 public static string gbk2unicode string str return result.tostring public static b...
中文 unicode互轉
中文,unicode互轉。網上有些只有一種轉換,有些有問題。自己測試無問題,主要用於解決odb資料庫問題。將中文轉化為unicode碼 public static string gbk2unicode string str return result.tostring public static b...