計算機常用編碼

2021-10-07 15:44:06 字數 881 閱讀 2321

1、常用編碼介紹

(1)ascii碼表,只有0-127,128位,使用了乙個位元組的低7位,剩餘的128位作為擴充套件

(2)iso-8859-*使用了ascii碼剩餘的128位作為擴充套件,常用:iso-8859-1

(3)gb2312 中文簡體字集,包含6763個簡體中文本

(4)big5大五碼,繁體字集

(5)unicode統一字符集,簡稱ucs

(6)gbk包含gb2312和big5簡繁字集,向下完全相容gb2312,使用gbk開啟gb2312的文字不會亂碼,共21003個字元

(7)utf-8萬國碼,包含世界所有國家的字元

2、ascii碼表

常用:0-9 a-z a-z 分別對應ascii碼的48-57 、65-90 、97-122

3、亂碼產生原因

計算機中檔案的儲存都是以二進位制的形式儲存的,在儲存到硬碟上時,計算機會將記憶體中的檔案,按照特定的格式[編碼方式]轉換為二進位制檔案,儲存到硬碟中;

當檔案再次開啟時,計算機會把硬碟中的二進位制檔案載入到記憶體,按照特定的格式,重新編碼成可讀的普通檔案;

重新編碼時,系統會搜尋當前系統中,對於不同字尾名檔案的預設開啟方式[每種開啟方式包含的編碼不一定相同],如果預設的開啟方式中包含的編碼方式與原編碼格式相同,則檔案可以正常開啟,沒有亂碼;

4、解決亂碼

在儲存檔案時,確定編輯儲存的編碼方式

在開啟檔案時,要根據不同的檔案字尾名,選擇對應的開啟方式

5、notepad++等記事本中的亂碼問題

編寫一段文字,使用utf-8編碼格式進行儲存;

開啟時選用不同的編碼方式檢視顯示的效果

計算機常用編碼方式

常用編碼方式 標準ascii碼 擴充套件ascii碼 utf 8 utf 16。用乙個位元組大小表示常用的字元,最開始ascii碼只表示128個字元,只需要7位表示,最高位統一用0表示。ascii碼編碼方式通過大端方式對齊。不同國家,使用的字元不一致,僅僅128個字元不夠使用,所以針對本國字元特點,...

計算機編碼 編碼

原碼 a.規則 最高位為符號位,0為正數,1為負數,剩餘位表示資料 b.例 95 原 0101 1111 原 77 原 11001101 原 c.特點 區分正負零 缺陷 0 原 0000 0000 0 原 1000 0000 原碼可能出錯 1 原 1 原 1000 0010 原 2 d d.範圍 8...

計算機編碼

來自 阮一峰 一下對自己有用的精簡部分 1.ascii碼 在計算機內部,所有的資訊最終都表示為乙個二進位制的字串。每乙個二進位制位有0和1兩種狀態,因此八個二進位制位就可以組合出256種狀態,這被稱為乙個位元組 byte 也就是說,乙個位元組一共可以用來表示256種不同的狀態,每乙個狀態對應乙個符號...