經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會用反碼和,而不是直接求和呢?或者是補碼和呢?因為在計算機裡面資料是以補碼的形式存在啊!經過看書查資料,下面總結一些這個校驗和演算法具體是怎麼實現的。
首先,ip、icmp、udp和tcp報文頭都有檢驗和字段,大小都是16bit,演算法基本上也是一樣的。
在傳送資料時,為了計算資料報的檢驗和。應該按如下步驟:
1、把校驗和字段設定為0;
2、把需要校驗的資料看成以16位為單位的數子組成,依次進行二進位制反碼求和;
3、把得到的結果存入校驗和字段中
在接收資料時,計算資料報的檢驗和相對簡單,按如下步驟:
1、把首部看成以16位為單位的數字組成,依次進行二進位制反碼求和,包括校驗和字段;
2、檢查計算出的校驗和的結果是否為0;
3、如果等於0,說明被整除,校驗和正確。否則,校驗和就是錯誤的,協議棧要拋棄這個資料報。
雖然說上面四種報文的校驗和演算法一樣,但是在作用範圍存在不同:ip校驗和只校驗20位元組的ip報頭;而icmp校驗和覆蓋整個報文(icmp報頭+icmp資料);udp和tcp校驗和不僅覆蓋整個報文,而且還有12個位元組的ip偽首部,包括源ip位址(4位元組)、目的ip位址(4位元組)、協議(2位元組)、tcp/udp包長(2位元組)。另外udp、tcp資料報的長度可以為奇數位元組,所以在計算校驗和時需要在最後增加填充位元組0(填充位元組只是為了計算校驗和,可以不被傳送)。
在udo傳輸協議中,校驗和是可選的,當校驗和字段為0時,表明該udp報文未使用校驗和,接收方就不需要校驗和檢查了!那如果udp校驗和的計算結果是0時怎麼辦?書上有一句話:「如果校驗和的計算結果為0,則存入的值為全1(65535),這在二進位制反碼計算中是等效的」
那麼校驗和到底怎麼計算了?
1、什麼是二進位制反碼求和
對乙個無符號的數,先求其反碼,然後從低位到高位,按位相加,有益處則向高位進1(和一般的二進位制法則一樣),若最高位有進製,則向最低位進1.
首先這裡的反反碼好像和以前學的有符號反碼不一樣,這裡不分正負數,直接每個為都取反。
上面加粗的那句話和我們平時的加法法則不一樣,最高位有進製,則向最低位進1。確實有些疑惑,為什麼要這樣呢?自習分析一下,上面的這種操作,使得在傳送加法進製溢位時,溢位值並不是10000,而是1111.也即是當相加結果滿1111時溢位,這樣也可以說明為什麼0000和1111都表示0了。
下面是兩種二進位制反碼求和的運算:
原碼加法運算:3(0011)+5(0101)=8(1000)
8(1000)+9(1001)=1(0001)
反碼加法運算:3(1100)+5(1010)=8(0111)
8(0111)+9(0110)=2(1101)
從上面的例子中,當加法未發生溢位時,原碼與反碼加法運算結果一樣;當有溢位時,結果就不一樣了,原碼是滿10000溢位,而反碼是滿1111溢位,所以相差正好是1.
另外,關於二進位制反碼求和運算需要說明的一點是,先取反後相加與先相加後取反,得到的結果是一樣的。
2、校驗和演算法實現
**如下:
ushort checksum (ushort *buffer,int size)
if (size)
//將32位轉換為16位
while (cksum>>16)
cksum = (cksum>>16) + (cksum & 0xffff);
return (ushort) (~cksum);
}
buffer是指向需要校驗資料緩衝區的指標,size是需要檢驗資料的總長度(位元組為單位)。
4-13行**是對資料按16bit累加求和,由於最高位的進製需要加在最低位上,所以cksum必須是32位的unsigned long型,高16bit用於儲存累加過程中的進製;另外**10~13行是對size為奇數情況的處理。
4~16行**的作用是將cksum高16bit的值加到低16bit上,即把累加中最高位的進製加到最低位上。這裡使用了while迴圈,判斷cksum高16bit是否非零,因為第16行**執行的時候,還是可能向cksum的高16bit進製。
有些地方是通過下面兩條**實現的:
cksum = (cksum >> 16) + (cksum & 0xffff);
cksum = (cksum >> 16);
這裡只進行了兩次相加,即可保證相加後cksum的高16位為0,兩種方式的效果是一樣,事實上,上面的迴圈也最多執行兩次!
17行**即對16bit資料累加的結果取反,得到二進位制反碼求和的結果,然後函式返回該值。
3、為什麼使用二進位制反碼求和呢?
為什麼要使用二進位制反碼來計算校驗和呢,而不是直接使用原碼或者是補碼呢?
在谷歌上找到一篇相關的文章:
上面是原文的一部分,說明在tcp/ip校驗和中使用反碼求和的一些優點:
a、 不依賴系統是大端小端。即無論你是傳送方計算機或者接收方檢查校驗和時,都不要呼叫htons或者ntohs,直接通過上面的演算法就可以得到正確的結果。這個問題你可以自己舉個例子,用反碼求和時,交換16位數的位元組順序,得到的結果相同,只是位元組順序相應地也交換了;而如果使用原碼或者補碼求和,得到的結果可能就不同。
b、 計算和驗證校驗和比較簡單、快遞。
校驗和演算法
校驗和演算法 經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會...
校驗和演算法
校驗和演算法 經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會...
校驗和演算法
校驗和演算法 經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會...