c 實現GB2312和UTF8字元編碼方式的轉換

2021-04-29 05:45:20 字數 902 閱讀 9699

c#實現gb2312和utf8字元編碼方式的轉換

public string utf8togb2312(string str)

catch  (exception ex)//(unsupportedencodingexception ex)

}public string gb2312toutf8(string str)

byte temp1 = encoding.convert(gb2312, uft8, temp);

messagebox.show("uft8的編碼的位元組個數:" + temp1.length);

for (int i = 0; i < temp1.length; i++)

string result = uft8.getstring(temp1);

return result;

}catch  (exception ex)//(unsupportedencodingexception ex)}

**說明:

encoding utf8 = encoding.getencoding(65001);//使用code page

encoding gb2312 = encoding.getencoding("gb2312");//通過bodyname

獲取字元編碼位元組序列:byte temp=utf8.getbytes("http://www.my400800.cn

400**受理 ");

編碼方式轉換:byte temp1=encoding.convert(utf8, gb2312, temp);

獲取編碼的字串:string str1=gb2312.getstring(temp1);

這樣即完成了字元編碼的轉換。

encoding.default在 簡體中文os中一般是gb2312格式。

gb2312和UTF 8的區別

gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字更多,...

GB2312 和 UTF 8的區別

本文 gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字...

GB2312和utf8編碼轉換

經常的寫中文出現亂碼,用編碼器翻譯在粘上去,有的還翻譯不過去。還是用翻譯函式吧 gb2312轉換成utf 8 utf iconv gb2312 utf 8 request keyword 將字串utf 8碼轉換為gb2312碼 str iconv utf 8 gb2312 translit str ...