1.要解決中文亂碼問題。首先得了解什麼是字元編碼
計算機要處理各種字元,就須要將字元和二進位制內碼相應起來,這樣的相應關係就是字元編碼。
要制定字元編碼首先要確定字符集,並將
字符集內的字元排序。然後和二進位制數字相應起來。依據字符集內字元的多少。確定幾個位元組來編碼。
2.經常使用的字元編碼
ascii 編碼是眼下計算機中經常使用的最廣泛地 字符集及其編碼。
iso-8859-1能夠表示的是西歐語言。看起來非常單一,可是因為是單位元組編碼,與計算機最基礎的表示單位一致,所以在非常多時候。仍舊使用iso-8859-1編碼來表示,並且在非常多協議上預設使用這樣的編碼。
unicode編碼(統一碼),通常所說的utf-8就是unicode編碼的實現方式。
gb2312字集是簡體字集。big5字集是台灣繁體字集;gbk字集是簡繁字集;gb18030 是國家制定的乙個強制性大字集標準;linux系統預設的使用的是iso-8859-1編碼,。如今的pc平台必須支援gb18030。對嵌入式產品暫不作要求。所以手機、***一般僅僅支援gb2312。
3.網路傳輸產生中文亂碼原因
網路通訊中,產生亂碼的原因主要是通訊過程中使用了不同的編碼方式:server中的編碼方式,傳輸過程中的編碼方式,傳輸到達終端裝置的編碼方式。
因此在傳輸過程中就須要至少兩次編碼轉換:首先從server編碼轉為網路編碼,再從網路編碼轉為終端裝置編碼。在轉換的過程中出現不論什麼情況都可能出現編碼混亂。
4.處理中文亂碼問題經常使用兩種方式解決
(1)因為大部分終端裝置都支援unicode字符集。所以在連線網頁時。我們希望網頁資料在網路傳輸時使用utf-8方式傳輸,我們就能夠將utf-8轉化為unicode字符集。以下我們將通訊過程中得到的流轉化為位元組。然後再將位元組按gb2312 的方式進行轉換得到字串。
inputstream is = conn.getinputstream();
bufferedinputstream bis = new bufferedinputstream(is);
byte bytearray = new byte[1024];
int current= -1;
int i=0;
while((current=bis.read())!=-1)
resultdata = new string (bytearray,"gb2312");//網路中以位元組想形式默覺得utf-8進行編碼,以gb2312顯示到終端
通過上面的轉換,「resultdata」字串便能夠顯示中文效果了。
(2)還有一種方式是書記在傳遞的過程中使用iso-8859-1字符集,這樣就是直接使用了ascii編碼方式,當然在傳遞到終端裝置時。須要將其資料反轉才可以正常的顯示。
以下我們將乙個字串按iso-8859-1字符集進行轉換為gbk,**例如以下:
public static string formatstr(string str)
try}
總結:歸根結底,解決中文亂碼僅僅須要兩個步驟:
·使用getbytes("編碼方式");來對漢字進行重編碼。得到它的位元組陣列。
·再使用new string (bytes,"解碼");解碼相應的位元組陣列。
中國通訊產業鏈全掃瞄
1.終端 1.1終端晶元 射頻晶元 美信 鼎芯 銳迪科 廣晟微電子 基帶晶元 mtk 展訊 凱明 已經倒閉 t3g 重郵信科 多 晶元 飛思卡爾,英飛凌,marvell,corelogic,mtekvision 1.2 終端軟體 作業系統 科泰世紀 大唐移動 微軟 1.3 終端裝置 測試手機 大唐移...
Altibase記憶體資料庫助力中國通訊未來
專案背景 altibase是將資料存於不同的儲存介質並管理的資料庫管理系統 dbms 即同時支援記憶體資料庫 mmdb main memory database 和磁碟資料庫 drdb disk resident database 從而獲得極高的訪問速度和極強的併發訪問能力以及大容量儲存訪問,是記憶...
中國通訊製造業需要5G標準
文 柏銘007 目前各個國家和企業都在積極投入力量研發下一代通訊技術標準5g標準,從中國參與3g和4g標準制定獲得的好處,目前中國手機企業走向國際的需要,中國應該積極投身5g標準制定工作中。中國成功推動td scdma和td lte產業鏈發展 3g時代歐洲通過修改cdma推出了wcdma標準,而中國...