關於gb2312編碼的xml解析

2021-06-20 22:30:10 字數 1562 閱讀 5274

在ios專案中遇到這樣乙個問題,需要讀取遠端的xml檔案,進行解析,但是目標xml是gb2312編碼的,用system.text.encoding.getencoding("gb2312")並不奏效。提示「encoding name 'gb2312' not supported」,查了下才知道getencoding只支援下面四個屬性:

}另一處理方式:

webclient client = new webclient ();

//gb2312encoding gb2312 = new gb2312encoding ();

= gb2312;

client.downloadfile (xmlurl, localpath);

stream str = client.openread (xmlurl);

//streamreader reader = new streamreader (str);

byte mbyte = new byte[str.length + 1];

int allmybyte = mbyte.length;

int startmbyte = 0;

while (allmybyte > 0)

//編碼處理

gb2312encoding gb2312 = new gb2312encoding ();

string chinesestr = gb2312.getstring (mbyte, 0, mbyte.length);

chinesestr = chinesestr.replace ("=\"gb2312\"", "=\"utf-8\"");

file.writealltext (localpath, chinesestr);

str.close ();

//讀取xml物件

xmlserializer serializer = new xmlserializer (typeof(coursevido.course));

using (textreader reader = new streamreader (localpath))

return result;

GB2312編碼範圍

gb2312編碼範圍 a1a1 fefe,其中漢字編碼範圍 b0a1 f7fe。gb2312編碼是第乙個漢字編碼國家標準,由中國國家標準總局1980年發布,1981年5月1日開始使用。gb2312編碼共收錄漢字6763個,其中一級漢字3755個,二級漢字3008個。同時,gb2312編碼收錄了包括拉...

GB2312的編碼規則

gb2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個 同時,gb2312收錄了包括拉丁字母 希臘字母 日文平假名及片假名字母 俄羅斯語西里爾字母在內的682個全形字符。gb2312的出現,基本滿足了漢字的計算機處理需要,它所收錄的漢字已經覆蓋99.75 的使用頻率。gb2...

編碼學習整理(二) GB2312

gb 2312或gb 2312 80是乙個簡體中文 字符集的中國國家標準,全稱為 資訊交換用漢字編碼字符集 基本集 又稱為gb0,由中國國家標準總局發布,1981年 5月1日實施。gb2312編碼通行於中國大陸 新加坡等地也採用此編碼。中國大陸幾乎所有的中文系統和國際化的軟體都支援gb 2312。g...