c#實現gb2312和utf8字元編碼方式的轉換
public string utf8togb2312(string str)
catch (exception ex)//(unsupportedencodingexception ex)
}public string gb2312toutf8(string str)
byte temp1 = encoding.convert(gb2312, uft8, temp);
messagebox.show("uft8的編碼的位元組個數:" + temp1.length);
for (int i = 0; i < temp1.length; i++)
string result = uft8.getstring(temp1);
return result;
}catch (exception ex)//(unsupportedencodingexception ex)}
**說明:
encoding utf8 = encoding.getencoding(65001);//使用code page
encoding gb2312 = encoding.getencoding("gb2312");//通過bodyname
獲取字元編碼位元組序列:byte temp=utf8.getbytes("http://www.my400800.cn
400**受理 ");
編碼方式轉換:byte temp1=encoding.convert(utf8, gb2312, temp);
獲取編碼的字串:string str1=gb2312.getstring(temp1);
這樣即完成了字元編碼的轉換。
encoding.default在 簡體中文os中一般是gb2312格式。
gb2312和UTF 8的區別
gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字更多,...
GB2312 和 UTF 8的區別
本文 gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字...
GB2312和utf8編碼轉換
經常的寫中文出現亂碼,用編碼器翻譯在粘上去,有的還翻譯不過去。還是用翻譯函式吧 gb2312轉換成utf 8 utf iconv gb2312 utf 8 request keyword 將字串utf 8碼轉換為gb2312碼 str iconv utf 8 gb2312 translit str ...