計算機中儲存的資訊都是用二進位制數表示的,而我們在螢幕上看到的數字、英文、標點符號、漢字等字元是二進位制數轉換之後的結果。按照某種規則,將字元儲存到計算機中,稱為編碼。反之,將儲存在計算機中的二進位制數按照某種規則解析顯示出來,稱為解碼。
亂碼的根本原因:
按照a規則儲存,同樣按照a規則解析,那麼就能顯示正確的文字符號。
反之,按照a規則儲存,再按照b規則解析,就會導致亂碼現象。
編碼:字元(能看懂的)–>位元組(看不懂的)
解碼:位元組(看不懂的)–>字元(能看懂的)
計算機要準確的儲存和識別各種字符集符號,需要進行字元編碼,一套字符集必然至少有一套字元編碼。常見字符集有ascii字符集、gbk字符集、unicode字符集等。
當指定了編碼,它所對應的字符集自然就指定了
ascii字符集:
iso-8859-1字符集:
gb***字符集:
unicode字符集:
字符集和字符集編碼詳解
gb2312 gbk ascii asni unicode utf 8等等,這些字眼非常常見,同時帶來許多的問題。本文只是從理解的角度,說明以上內容的不同含義從而達到區分其用法的目的是夠了的。至於實現方式,可以查閱各自的詳細標準官方文件。先解釋乙個概念,什麼是字符集,嗯,不解釋了,我弄乙個吧 從今以...
字符集和字元編碼
字符集和字元編碼不錯的部落格 字符集 是乙個系統支援的所有抽象字元的集合。字元是各種文字和符號的總稱,包括各國家文字 標點符號 圖形符號 數字等。asicc,unicode,gbk,gb2312等 字元編碼 是一套法則,使用該法則能夠對自然語言的字元的乙個集合 如字母表或音節表 與其他東西的乙個集合...
字符集和字元編碼
字符集 建立文字檔案預設使用ansi,就是系統預設編碼方式,中文window系統預設使用gbk編碼方式 位元組 這是最基本的概念,位元組是計算儲存容量的一種計量單位,我們知道計算機只能識別1和0組成的二進位制位,乙個數就是1位 bit 為了方便計算,我們規定8位就是乙個位元組 字元 字元和位元組不太...