1、常用編碼介紹
(1)ascii碼表,只有0-127,128位,使用了乙個位元組的低7位,剩餘的128位作為擴充套件
(2)iso-8859-*使用了ascii碼剩餘的128位作為擴充套件,常用:iso-8859-1
(3)gb2312 中文簡體字集,包含6763個簡體中文本
(4)big5大五碼,繁體字集
(5)unicode統一字符集,簡稱ucs
(6)gbk包含gb2312和big5簡繁字集,向下完全相容gb2312,使用gbk開啟gb2312的文字不會亂碼,共21003個字元
(7)utf-8萬國碼,包含世界所有國家的字元
2、ascii碼表
常用:0-9 a-z a-z 分別對應ascii碼的48-57 、65-90 、97-122
3、亂碼產生原因
計算機中檔案的儲存都是以二進位制的形式儲存的,在儲存到硬碟上時,計算機會將記憶體中的檔案,按照特定的格式[編碼方式]轉換為二進位制檔案,儲存到硬碟中;
當檔案再次開啟時,計算機會把硬碟中的二進位制檔案載入到記憶體,按照特定的格式,重新編碼成可讀的普通檔案;
重新編碼時,系統會搜尋當前系統中,對於不同字尾名檔案的預設開啟方式[每種開啟方式包含的編碼不一定相同],如果預設的開啟方式中包含的編碼方式與原編碼格式相同,則檔案可以正常開啟,沒有亂碼;
4、解決亂碼
在儲存檔案時,確定編輯儲存的編碼方式
在開啟檔案時,要根據不同的檔案字尾名,選擇對應的開啟方式
5、notepad++等記事本中的亂碼問題
編寫一段文字,使用utf-8編碼格式進行儲存;
開啟時選用不同的編碼方式檢視顯示的效果
計算機常用編碼方式
常用編碼方式 標準ascii碼 擴充套件ascii碼 utf 8 utf 16。用乙個位元組大小表示常用的字元,最開始ascii碼只表示128個字元,只需要7位表示,最高位統一用0表示。ascii碼編碼方式通過大端方式對齊。不同國家,使用的字元不一致,僅僅128個字元不夠使用,所以針對本國字元特點,...
計算機編碼 編碼
原碼 a.規則 最高位為符號位,0為正數,1為負數,剩餘位表示資料 b.例 95 原 0101 1111 原 77 原 11001101 原 c.特點 區分正負零 缺陷 0 原 0000 0000 0 原 1000 0000 原碼可能出錯 1 原 1 原 1000 0010 原 2 d d.範圍 8...
計算機編碼
來自 阮一峰 一下對自己有用的精簡部分 1.ascii碼 在計算機內部,所有的資訊最終都表示為乙個二進位制的字串。每乙個二進位制位有0和1兩種狀態,因此八個二進位制位就可以組合出256種狀態,這被稱為乙個位元組 byte 也就是說,乙個位元組一共可以用來表示256種不同的狀態,每乙個狀態對應乙個符號...