字符集與字元編碼

2021-07-30 14:06:47 字數 752 閱讀 3733

字符集-

字符集是各種文字和符號的總稱,也就是多個字元的集合,而常見的字符集有:ascii字符集、iso 8859字符集、gb 2312字符集、big 5字符集、gbi 8030字符集、unicode字符集等。計算機要能夠識別和儲存各種字元,就要對各種字符集進行字元編碼。

字元編碼-

編碼和字符集不同,字符集只是字元的集合,不一定適合作網路傳送處理,有事必須編碼後才能應用,如:unicode可依不同需要以utf-16、utf-32等方式編碼,同時還有ansi編碼、ascii編碼。而字元編碼就是以二進位制的數字來對應字符集的字元,對字元進行編碼,是資訊交流的技術基礎,在傳送資料給對方前,需要事先告知對方自己所使用的編碼,或者通過轉碼,使不同編碼方案的兩個系統可溝通自如。

注意-

unicode字符集有多種編碼方式,如:utf-16等,ascii只有一種,大多數mbcs(包括gb3212)也只有一種。

進一步理解-

「字元的集合」和「編碼」一般都是同時制定的。因此,我們所說的「字符集」比如:gb2312、gbk、jis等除了所有「字元的集合」這層含義外同時也包含了「編碼」的含義。

字符集與字元編碼

字符集 charset 是乙個系統支援的所有抽象字元的集合。字元是各種文字和符號的總稱,包括各國家文字 標點符號 圖形符號 數字等。常用字符集 ascii 英語字符集,1位元組,前127是英文 數字,127 255是特殊符號 gb x gb2312,gb18030 字符集,2位元組,包含ascii前...

字符集與字元編碼

目錄 字符集和字元編碼 unicode字符集 utf 8 utf 16 ascii碼 中文字符集 gbk gb2312 gb18030 字符集 字符集只是乙個規則集合的名字,字符集 字型檔表 character repertoire 編碼字符集 coded character set 字元編碼 ch...

字符集與編碼

前言 今天notepad 檢視測試傳過來的乙個log,開啟後竟然有部分亂碼,無法檢視完整資訊,嘗試更改編碼後仍未能解決,同事告知使用瀏覽器開啟或許可以,於是搗鼓一下,使用瀏覽器開啟並選擇編碼unicode utf 8 後終於正常顯示,順利解決問題。亂碼顯示的問題以前也經常遇到,從未認真對待過,剛好稱...