網路位元組順序是tcp/ip中規定好的一種資料表示格式,它與具體的cpu型別、作業系統等無關,從而可以保證資料在不同主機之間傳輸時能夠被正確解釋,網路位元組順序採用big-endian排序(大尾順序)方式。
因為專案中需要,設定例如來自埠號為9877的資料要做些什麼處理,在上層設定了9877這個數字,但是讀取tcp頭部(tcp頭部的前十六位元組為源埠號),發現不是原想的9877這個數,而是38182。
因為他是傳入9877,通過htons()函式轉變為網路位元組順序(見上),也就能理解為何網路程式設計時候會使用:
servaddr.sin_port =htons(9877);
但是因為在開發板的核心中,無法直接呼叫這個函式,所以需要自己實現該功能,結合網上查詢,方法實現如下:
#define biglittleswap16(a) ((((uint16)(a) & 0xff00) >> 8) | (((uint16)(a) & 0x00ff) << 8))
int checkcpuendian()
c; c.i = 0x12345678;
return (0x12 == c.s[0]);
}unsigned
short
int htons(unsigned
short
int h)
下邊的是摘錄自
part 1: htons函式具體解釋
在linux和windows網路程式設計時需要用到htons和htonl函式,用來將主機位元組順序轉換為網路位元組順序。
在intel機器下,執行以下程式
int main()
...
得到的結果是4096,初一看感覺很怪。
解釋如下,數字16的16進製表示為0x0010,數字4096的16進製表示為0x1000。 由於intel機器是小尾端,儲存數字16時實際順序為1000,儲存4096時實際順序為0010。因此在傳送網路包時為了報文中資料為0010,需要經過htons進行位元組轉換。如果用ibm等大尾端機器,則沒有這種位元組順序轉換,但為了程式的可移植性,也最好用這個函式。
另外用注意,數字所佔位數小於或等於乙個位元組(8 bits)時,不要用htons轉換。這是因為對於主機來說,大小尾端的最小單位為位元組(byte)。
part 2: 大小端模式
不同的cpu有不同的位元組序型別 這些位元組序是指整數在記憶體中儲存的順序 這個叫做主機序
最常見的有兩種
1. little endian:將低序位元組儲存在起始位址
2. big endian:將高序位元組儲存在起始位址
le little-endian
最符合人的思維的位元組序
位址低位儲存值的低位
位址高位儲存值的高位
怎麼講是最符合人的思維的位元組序,是因為從人的第一觀感來說
低位值小,就應該放在記憶體位址小的地方,也即記憶體位址低位
反之,高位值就應該放在記憶體位址大的地方,也即記憶體位址高位
be big-endian
最直觀的位元組序
位址低位儲存值的高位
位址高位儲存值的低位
為什麼說直觀,不要考慮對應關係
只需要把記憶體位址從左到右按照由低到高的順序寫出
把值按照通常的高位到低位的順序寫出
兩者對照,乙個位元組乙個位元組的填充進去
例子:在記憶體中雙字0x01020304(dword)的儲存方式
記憶體位址
4000 4001 4002 4003
le 04 03 02 01
be 01 02 03 04
例子:如果我們將0x1234abcd寫入到以0x0000開始的記憶體中,則結果為
big-endian little-endian
0x0000 0x12 0xcd
0x0001 0x23 0xab
0x0002 0xab 0x34
0x0003 0xcd 0x12
x86系列cpu都是little-endian的位元組序.
網路位元組順序是tcp/ip中規定好的一種資料表示格式,它與具體的cpu型別、作業系統等無關,從而可以保證資料在不同主機之間傳輸時能夠被正確解釋。網路位元組順序採用big endian排序方式。
為了進行轉換 bsd socket提供了轉換的函式 有下面四個
htons 把unsigned short型別從主機序轉換到網路序
htonl 把unsigned long型別從主機序轉換到網路序
ntohs 把unsigned short型別從網路序轉換到主機序
ntohl 把unsigned long型別從網路序轉換到主機序
在使用little endian的系統中 這些函式會把位元組序進行轉換
在使用big endian型別的系統中 這些函式會定義成空巨集
同樣 在網路程式開發時 或是跨平台開發時 也應該注意保證只用一種位元組序 不然兩方的解釋不一樣就會產生bug.
注: 1、網路與主機位元組轉換函式:htons ntohs htonl ntohl (s 就是short l是long h是host n是network)
2、不同的cpu上執行不同的作業系統,位元組序也是不同的,參見下表。
處理器 作業系統 位元組排序
alpha 全部 little endian
hp-pa nt little endian
hp-pa unix big endian
intelx86 全部 little endian <—–x86系統是小端位元組序系統
motorola680x() 全部 big endian
mips nt little endian
mips unix big endian
powerpc nt little endian
powerpc 非nt big endian <—–ppc系統是大端位元組序系統
rs/6000 unix big endian
sparc unix big endian
ixp1200 arm核心 全部 little endian
part 3: 模擬htonl、ntohl、htons、ntohs函式實現
今天在如鵬網裡討論htonl、ntohl在不同機器的區別,特意模擬了htonl、ntohl、htons、ntohs函式實現。
實現如下:
typedef
unsigned
short
int uint16;
typedef
unsigned
long
int uint32;
// 短整型大小端互換
#define biglittleswap16(a) ((((uint16)(a) & 0xff00) >> 8) | /
(((uint16)(a) & 0x00ff) << 8))
// 長整型大小端互換
#define biglittleswap32(a) ((((uint32)(a) & 0xff000000) >> 24) | /
(((uint32)(a) & 0x00ff0000) >> 8) | /
(((uint32)(a) & 0x0000ff00) << 8) | /
(((uint32)(a) & 0x000000ff) << 24))
// 本機大端返回1,小端返回0
int checkcpuendian()
c; c.i = 0x12345678;
return (0x12 == c.s[0]);
}// 模擬htonl函式,本機位元組序轉網路位元組序
unsigned
long
int htonl(unsigned
long
int h)
// 模擬ntohl函式,網路位元組序轉本機位元組序
unsigned
long
int ntohl(unsigned
long
int n)
// 模擬htons函式,本機位元組序轉網路位元組序
unsigned
short
int htons(unsigned
short
int h)
// 模擬ntohs函式,網路位元組序轉本機位元組序
unsigned
short
int ntohs(unsigned
short
int n)
C語言 實現memcopy memmove函式
memmove用於從src拷貝count個字元到dest,如果目標區域和源區域有重疊的話,memmove能夠保證源串在被覆蓋之前將重疊區域的位元組拷貝到目標區域中。但複製後src內容會被更改。但是當目標區域與源區域沒有重疊則和memcpy函式功能相同。include include include ...
linux核心中用C語言實現物件導向思想
初衷 linux核心大量使用物件導向的編碼風格。然而linux核心是完全使用c寫的。專案使用的通訊規約也是物件導向的。物件導向一直是一種思想,c語言也可以實現其思想。物件導向思想 封裝繼承 建構函式多型 封裝就是猶抱琵琶半遮面,使用結構體。linux核心裡用到類的繼承關係,這種關係使用c語言實現就是...
PHP變數在核心中的實現
我們都知道php是乙個弱型別語言,它的變數理論上可以儲存任何型別的資料。那麼,php的變數在核心中究竟是怎麼實現的呢?在php核心中,變數稱為zval,變數的值稱為zend value,注意這是兩個不同的東西。php中變數的記憶體是通過引用計數的方式進行管理的,在php7之前,zval容器中有兩個位...