Unicode原理和互轉中文

**點

unicode標準的本意很簡單：希望給世界上每一種文字系統的每乙個字元，都分配乙個唯一的整數，這些整數叫做**點（code points）。

**空間

所有的**點構成乙個**空間（code space），根據unicode定義，總共有1,114,112個**點，編號從0x0到0x10ffff。換句話說，如果每個**點都能夠代表乙個有效字元的話，unicode標準最多能夠編碼1,114,112，也就是大概110多萬個字元。最新的unicode標準（7.0）已經給超過11萬個字元分配了**點。

**平面

unicode標準把**點分成了17個**平面（code plane），編號為#0到#16。

每個**平面包含65,536（2^16）個**點（17*65,536=1,114,112）。

其中，plane#0叫做基本多語言平面（basic multilingual plane，bmp），其餘平面叫做補充平面（supplementary planes）。

unicode7.0只使用了17個平面中的6個，並且給這6個平面起了名字，如下

public string getchinesebyunicode(string sunicode) 
}} else 
}return outbuffer.tostring();
}

中文 unicode互轉

中文，unicode互轉。網上有些只有一種轉換，有些有問題。自己測試無問題，主要用於解決odb資料庫問題。將中文轉化為unicode碼 public static string gbk2unicode string str return result.tostring public static b...

Unicode原理和互轉中文

中文 unicode互轉

中文 unicode互轉

中文 unicode互轉

相關推薦