關於使用gbk和utf8進行漢字編碼的學習總結。
gbk編碼規則簡述:
列表如下:
1位元組字元(ascii字元)
2位元組字元(漢字)
0******x
1******x ******xx
其中"x"代表0或1。
utf8編碼規則簡述:
注意漢字的編碼前面至少有2個1(有幾個1就表示該漢字用幾個位元組表示)。
列表如下:
1位元組字元(ascii字元)
2位元組字元(漢字)
3位元組字元(漢字)
4位元組字元(漢字)
5位元組字元(漢字)
6位元組字元(漢字)
0******x
110***xx
10******
1110***x
10******
10******
11110***
10******
10******
10******
111110xx
10******
10******
10******
10******
1111110x
10******
10******
10******
10******
10******
[1] ***的講義-chinese-encoding
漢字編碼問題
漢字編碼問題 由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5月...
漢字編碼問題
漢字編碼問題 由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5月...
漢字編碼問題
由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5 月1日實施,通...