校驗和演算法
經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會用反碼和,而不是直接求和呢?或者是補碼和呢?因為在計算機裡面資料是以補碼的形式存在啊!經過看書查資料,下面總結一些這個校驗和演算法具體是怎麼實現的。
首先,ip、icmp、udp和tcp報文頭都有檢驗和字段,大小都是16bit,演算法基本上也是一樣的。
在傳送資料時,為了計算資料報的檢驗和。應該按如下步驟:
1、把校驗和字段設定為0;
2、把需要校驗的資料看成以16位為單位的數字組成,依次進行二進位制反碼求和;
3、把得到的結果存入校驗和字段中
在接收資料時,計算資料報的檢驗和相對簡單,按如下步驟:
1、把首部看成以16位為單位的數字組成,依次進行二進位制反碼求和,包括校驗和字段;
2、檢查計算出的校驗和的結果是否為0;
3、如果等於0,說明被整除,校驗和正確。否則,校驗和就是錯誤的,協議棧要拋棄這個資料報。
雖然說上面四種報文的校驗和演算法一樣,但是在作用範圍存在不同:ip校驗和只校驗20位元組的ip報頭;而icmp校驗和覆蓋整個報文(icmp報頭+icmp資料);udp和tcp校驗和不僅覆蓋整個報文,而且還有12個位元組的ip偽首部,包括源ip位址(4位元組)、目的ip位址(4位元組)、協議(2位元組)、tcp/udp包長(2位元組)。另外udp、tcp資料報的長度可以為奇數位元組,所以在計算校驗和時需要在最後增加填充位元組0(填充位元組只是為了計算校驗和,可以不被傳送)。
在udo傳輸協議中,校驗和是可選的,當校驗和字段為0時,表明該udp報文未使用校驗和,接收方就不需要校驗和檢查了!那如果udp校驗和的計算結果是0時怎麼辦?書上有一句話:「如果校驗和的計算結果為0,則存入的值為全1(65535),這在二進位制反碼計算中是等效的」
那麼校驗和到底怎麼計算了?
1、什麼是二進位制反碼求和
對乙個無符號的數,先求其反碼,然後從低位到高位,按位相加,有益處則向高位進1(和一般的二進位制法則一樣),若最高位有進製,則向最低位進1.
首先這裡的反反碼好像和以前學的有符號反碼不一樣,這裡不分正負數,直接每個為都取反。
上面加粗的那句話和我們平時的加法法則不一樣,最高位有進製,則向最低位進1。確實有些疑惑,為什麼要這樣呢?自習分析一下,上面的這種操作,使得在傳送加法進製溢位時,溢位值並不是10000,而是1111.也即是當相加結果滿1111時溢位,這樣也可以說明為什麼0000和1111都表示0了。
下面是兩種二進位制反碼求和的運算:
原碼加法運算:3(0011)+5(0101)=8(1000)
8(1000)+9(1001)=1(0001)
反碼加法運算:3(1100)+5(1010)=8(0111)
8(0111)+9(0110)=2(1101)
從上面的例子中,當加法未發生溢位時,原碼與反碼加法運算結果一樣;當有溢位時,結果就不一樣了,原碼是滿10000溢位,而反碼是滿1111溢位,所以相差正好是1.
另外,關於二進位制反碼求和運算需要說明的一點是,先取反後相加與先相加後取反,得到的結果是一樣的。
2、校驗和演算法實現
**如下:
ushort checksum (ushort *buffer,int size)
if (size)
//將32位轉換為16位
while (cksum>>16)
cksum = (cksum>>16) + (cksum & 0xffff);
return (ushort) (~cksum);
}buffer是指向需要校驗資料緩衝區的指標,size是需要檢驗資料的總長度(位元組為單位)。
4-13行**是對資料按16bit累加求和,由於最高位的進製需要加在最低位上,所以cksum必須是32位的unsigned long型,高16bit用於儲存累加過程中的進製;另外**10~13行是對size為奇數情況的處理。
14~16行**的作用是將cksum高16bit的值加到低16bit上,即把累加中最高位的進製加到最低位上。這裡使用了while迴圈,判斷cksum高16bit是否非零,因為第16行**執行的時候,還是可能向cksum的高16bit進製。
有些地方是通過下面兩條**實現的:
cksum = (cksum >> 16) + (cksum & 0xffff);
cksum += (cksum >> 16);
這裡只進行了兩次相加,即可保證相加後cksum的高16位為0,兩種方式的效果是一樣,事實上,上面的迴圈也最多執行兩次!
17行**即對16bit資料累加的結果取反,得到二進位制反碼求和的結果,然後函式返回該值。
3、為什麼使用二進位制反碼求和呢?
為什麼要使用二進位制反碼來計算校驗和呢,而不是直接使用原碼或者是補碼呢?
上面是原文的一部分,說明在tcp/ip校驗和中使用反碼求和的一些優點:
校驗演算法之二進位制反碼求和
ip icmp igmp tcp udp等協議的校驗和演算法都是相同的,演算法如下 在傳送資料時,為了計算數ip據報的校驗和。應該按如下步驟 1 把ip資料報的首部都置為0,包括校驗和字段。2 把首部看成以16位為單位的數字組成,依次進行二進位制反碼求和。3 把得到的結果存入校驗和字段中。在接收資料...
校驗演算法之二進位制反碼求和
ip icmp igmp tcp udp等協議的校驗和演算法都是相同的,演算法如下 在傳送資料時,為了計算數ip據報的校驗和。應該按如下步驟 1 把ip資料報的首部都置為0,包括校驗和字段。2 把首部看成以16位為單位的數字組成,依次進行二進位制反碼求和。3 把得到的結果存入校驗和字段中。在接收資料...
TCP IP 中的二進位制反碼求和演算法
對於這個演算法,很多書上只是說一下思路,沒有具體的實現。我在這裡舉個例子吧。以4bit 計算方便一點,和16bit是一樣的 做檢驗和來驗證。建設原始資料為 1100 1010 0000 校驗位 那麼把他們按照4bit一組進行按位取反相加。1100取反0011 1010取反是0101,0011加上01...