常用編碼簡單說明

2021-09-09 01:56:29 字數 1140 閱讀 6933

ascii編碼:

這是最早的一種編碼,很多其他的編碼都會相容ascii編碼,ascii編碼只包含常用的英文本母,數字,以及一些特殊字元,還有部分控制字元。

每個字元由占用乙個位元組的儲存空間,因為最多隻包含127個字元,而乙個位元組(8bit)最多可以存256(2^8)個字元,故其最高位都為0。

例如大寫英文本母'a'對應的ascii碼值為65,用二進位制表示就是01000001.

gb2312編碼:

由於計算機是美國人發明的,在設計編碼的時候沒有考慮到別國的文字,而ascii編碼中是不包含別國的文字的,比如中文。所以想 要在計算機中顯示

我們的中文,就必須制定一套中文編碼規範,而gb2312就是其中一種,該編碼方式包含常用的中文字元。而且相容ascii編碼,在gb2312編碼中,ascii

字元還是跟原來一樣占用乙個位元組,乙個中文字元占用2個位元組,ascii字元的碼值在0-127之間,中文字元的兩個位元組的碼值都是在127-256之間。

gbk編碼:

gbk也是一種中文編碼,其相容gb2312編碼,並且比gb2312包含了更多的漢字,與gb2312不同的是gbk在儲存中文時,第乙個位元組碼值在127-256之間,

第二個位元組的碼值在0-256之間,所以gbk能表示更多的漢字。

utf-8編碼:

utf-8是一種國際化的編碼方式,其包含世界各國的大部分文字,並且相容ascii編碼。在utf-8中,用1-6個位元組來儲存乙個字元。具體如何區分某個字元

佔幾個位元組呢?這就要看字元的第乙個位元組特徵了

當第乙個位元組的二進位制以『0』開頭時,表示這是個ascii字元,即只佔乙個位元組

當以'110'開頭時,表示這個字元佔2個位元組,其後的1個位元組也屬於該字元

當以'1110'開頭時,表示這個字元佔3個位元組,其後的2個位元組也屬於該字元,

當以'11110'開頭時,表示這個字元佔4個位元組,其後的3個位元組也屬於該字元

當以'111110'開頭時,表示這個字元佔5個位元組,其後的4個位元組也屬於該字元

當以'1111110'開頭時,表示這個字元佔6個位元組,其後的5個位元組也屬於該字元

其中大部分的中文在utf8中都佔3個位元組,即第乙個位元組以1110開頭那一類。

字元編碼簡單說明

編碼可以指定總結 這裡的字元指所有文字 漢字英文日文等 數字 符號 中英等符號 數學符號等 首先資料都是儲存在介質 比如磁碟 上的,然後資料儲存的形式都是位元組形式。位元組是8位元資料,就是有八位二進位制的01序列組合。所有資料都是以01010111這種01序列儲存的。你肯定是在想,只用01就能儲存...

FormatMessage簡單說明

常用引數簡介.formatmessage format message from system format message allocate buffer,null,lval,null,lptstr hlocal,0,null 第乙個引數是標誌,告訴這個formatmessage函式,我想要的特點...

Subversion 簡單說明

subversion 簡單說明 checkout 從源 管理伺服器取出 commit 提交更新的 到源 管理伺服器。update 從源 管理伺服器獲取 的最新更新。export 從源 管理伺服器匯出 匯出的 將脫離源 管理。revert 將當前資料恢復到最近與伺服器同步的版本,即放棄自己的所有未提交...