分字 漢字編碼

2022-09-12 20:57:17 字數 731 閱讀 1826

關於使用gbk和utf8進行漢字編碼的學習總結。

gbk編碼規則簡述:

列表如下:

1位元組字元(ascii字元)

2位元組字元(漢字)

0******x

1******x ******xx

其中"x"代表0或1。

utf8編碼規則簡述:

注意漢字的編碼前面至少有2個1(有幾個1就表示該漢字用幾個位元組表示)。

列表如下:

1位元組字元(ascii字元)

2位元組字元(漢字)

3位元組字元(漢字)

4位元組字元(漢字)

5位元組字元(漢字)

6位元組字元(漢字)

0******x

110***xx

10******

1110***x

10******

10******

11110***

10******

10******

10******

111110xx

10******

10******

10******

10******

1111110x

10******

10******

10******

10******

10******

[1] ***的講義-chinese-encoding

漢字編碼問題

漢字編碼問題 由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5月...

漢字編碼問題

漢字編碼問題 由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5月...

漢字編碼問題

由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5 月1日實施,通...