編碼與校驗碼

2021-09-26 22:19:52 字數 1474 閱讀 2002

編碼: 數值,文字和英文本元等在進入計算機時,都必須轉化成二進位制表示形式,稱為字元編碼.

ascii: 美國標準資訊交換碼.

採用7個二進位制位對字元編碼, 其格式為為乙個字元有乙個編碼.

每個字元占用乙個位元組, 用低七位編碼,最高位為0。 共有128個編碼.  編號從0~127

a:   0100 0001  

a:   0110 0001

漢字處理包括漢子的編碼輸入,漢字的儲存和漢字輸出等環節,過程:

外部(輸入)碼  ---> 機內碼 ----->字形(輸出)碼

數字碼, 拼音碼, 子形碼

是漢字在資訊處理系統內部儲存,處理,傳輸漢字時用的**

區位碼:

是一種基於gb2312-80字符集(94行×94列)的輸入碼,

使用十進位制表示其區碼範圍(01~94)和位碼範圍(01~94),各佔兩位,故每個漢字對應4位十進位制數碼(範圍0101~9494)。

國標碼

則用16進製表示兩個位元組 , 前後位元組分別對應區位碼的區碼(加上32或20h)和位碼(加上32或20h)

機內碼也用16進製表示兩個位元組,將國標碼的前後兩個位元組最高位置1

機內碼

是內部儲存處理漢字時使用的編碼,用兩個位元組表示乙個漢字,將國標碼的兩個位元組高位置1 ,避免與ascii碼衝突;

以 '久' 為例子:

久的區位碼:3035   => ( 00011110 00100011b)

國標碼(區碼,位碼加 32):       0001 1110    0010 0011

+          0010 0000      0010 0011

=        0011 1110  0100 0011 

機內碼(將國標碼最高位置1):       1011 1110 1100 0011

是漢字字形的字·模資料, 通常用位圖,向量函式等方式表示。是漢字的輸入形式

在k位資料碼之外增加1位校驗碼,使k+1位為偶數(偶校驗)或奇數(奇校驗)

原資料    偶校驗       奇校驗

00011000100001 

1.

校驗碼 奇偶校驗碼

1.奇偶校驗碼 通過在編碼中增加一位校驗位來使編碼中1的個數為奇數或者偶數,校驗位可以在原編碼的前面或者後面加。通過加入校驗位後的1個數是奇數還是偶數,可分為兩種 奇校驗 1的個數為奇數 偶校驗 1的個數為偶數 下圖為奇校驗和偶校驗的設定方法。例如 m的ascii碼77,二進位制表示為0100110...

校驗碼 迴圈冗餘校驗碼

迴圈冗餘校驗碼,又稱crc碼。它利用生成多項式來為k個資料位產生r個校驗位來進行編碼。其編碼長度為k r。迴圈冗餘校驗碼由兩部分組成,左邊為資訊碼 資料 右邊為校驗碼,如下圖 若資訊碼佔k位,則校驗碼就佔n k位,其中,n為crc碼的字長,所以又稱為 n,k 碼。校驗碼位數越多,校驗能力越強。crc...

常用校驗碼(奇偶校驗碼 海明校驗碼 CRC校驗碼)

一 奇偶校驗碼 二 海明校驗碼 三 crc校驗碼 計算機系統執行時,各個部之間要進行資料交換.交換的過程中,會有發生誤碼的可能 即0變成1或1變成0 由於計算機的儲存是通過二進位制 來實現的的,誤碼會導致儲存的內容發生改變。為確保資料在傳送過程正確無誤,常使用檢驗碼.我們常使用的檢驗碼有三種.分別是...