碼表 Unicode GBK UTF8 示例

2021-09-07 08:29:43 字數 2436 閱讀 4169

/**

* unicode的編碼形式與對應的字串相互轉換

* @author 白幹濤

*/publicclassunicodeutils ";//所有的引號和反斜槓前面都要加乙個反斜槓

system.out.println(unicodetostring(unicodemessages) + "\n")

;// }

private

static

void test1()

private

static

void test2()

system.out.println("\n"

+ unicode);//同樣,這裡也不會解碼。【\u0061\u0041\u0031\u003a\u4e2d\u56fd】 }

/*** 將【字元】轉換成unicode碼形式【unicode用兩個位元組來編碼乙個字元,2^16=16^4,所以可以用四個16進製制數表示】

*/public

static string tounicodestring(char

c)

return sb.tostring();

} /**

* 將【字串】轉換成unicode碼形式

*/public

static string tounicodestring(string string)

return sb.tostring();

} /**

* 將unicode編碼解析成字串形式

*/public

static string unicodetostring(string ustring) }

return sb.tostring();

} }

/*** 字串編碼格式轉換

* @author 白幹濤

*/publicclasscodeutils 

/*** gbk轉utf8

* @param gbk    gbk編碼格式的字串

* @return    utf8編碼格式的字串

*/public

static string gbk2utf8(string gbk)

/*** utf8轉gbk

* @param utf    utf8編碼格式的字串

* @return    gbk編碼格式的字串

*/public

static string utf2gbk(string utf)

/***gbk轉unicode

* @param str    gbk編碼格式的字串

* @return string    unicode編碼格式的字串

*/public

static string gbk2unicode(string str)

+ integer.tohexstring((int)

chr1));

}return result.tostring();

}/**

*unicode轉gbk

* @param datastr    unicode編碼格式的字串

* @return string    gbk編碼格式的字串

*/public

static string unicode2gbk(string datastr)

string charstr = "";

charstr = datastr.substring(index + 2, index + 6);

char letter = (char) integer.parseint(

charstr, 16);

index += 6;

}return buffer.tostring();

}/**

* utf8轉unicode

* @param instr    utf8編碼格式的字串

* @return        unicode編碼格式的字串

*/public

static string utf2unicode(string instr)

else

if(ub == unicodeblock.halfwidth_and_fullwidth_forms)

else

}return sb.tostring();

}/**

*unicode轉utf8

* @param thestring        unicode編碼格式的字串

* @return string    utf8編碼格式的字串

*/public

static string unicode2utf8(string thestring)}}

else}}

return outbuffer.tostring();}}

null

碼表 Unicode GBK UTF8 示例

unicode的編碼形式與對應的字串相互轉換 author 白幹濤 publicclassunicodeutils 所有的引號和反斜槓前面都要加乙個反斜槓 system.out.println unicodetostring unicodemessages n private static void...

ASCII 碼表對照

ascii碼表 ascii碼大致可以分作三部分組成。第一部分是 ascii非列印控制字元 第二部分是 ascii列印字元 第三部分是 擴充套件ascii列印字元 ascii碼表 ascii值 控制字元 ascii值 控制字元 ascii值 控制字元 ascii值 控制字元 0nul 32 space...

常用ASCII碼表

十進位制 縮寫可以顯示的表示法 名稱 意義 0nul 空字元 null 1soh 標題開始 2stx 本文開始 3etx 本文結束 4eot 傳輸結束 5enq 請求 6ack 確認回應 7bel 響鈴 8bs 退格 9ht 水平定位符號 10lf 換行鍵 11vt 垂直定位符號 12ff 換頁鍵 ...