因為現行的計算機都是以八位乙個位元組為儲存單位,那麼乙個16位的整數,也就是c語言中的short,在記憶體中可能有兩種儲存順序big-
endian和litte-endian.考慮乙個short整數0x3132(0x32是低位,0x31是高位),把它賦值給乙個short變數,那麼它在記憶體中的儲存可
能有如下兩種情況:
大端位元組(big-endian):
short變數位址
0x1000 0x1001
___________________________________
| |
| 0x31 | 0x32
|________________ | ________________
高位位元組在低位位元組的前面,也就是高位在記憶體位址低的一端.可以這樣記住(大端->高位->在前->正常的邏輯順序)
小端位元組(little-endian):
short變數位址
0x1000 0x1001
_____________________________________
| |
| 0x32 | 0x31
|________________ | __________________
低位位元組在高位位元組的前面,也就是低位在記憶體位址低的一端.可以這樣記住(小端->低位->在前->與正常邏輯順序相反)
可以做個實驗
在windows上下如下程式
#include
<
stdio.h
>
#include
<
assert.h
>
void
main(
void)
然後在c盤下開啟test.txt檔案,可以看見內容是21,而test等於0x3132,可以明顯的看出來x86的位元組順序是低位在前.如果我們
把這段同樣的**放到(big-endian)的機器上執行,那麼打出來的檔案就是12.這在本機中使用是沒有問題的.但當你把這個檔案從一
個big- endian機器複製到乙個little-endian機器上時就出現問題了.
如上述例子,我們在big-endian的機器上建立了這個test檔案,把其複製到little-endian的機器上再用fread讀到乙個 short裡
面,我們得到的就不再是0x3132而是0x3231了,這樣讀到的資料就是錯誤的,所以在兩個位元組順序不一樣的機器上傳輸資料時需要特別
小心位元組順序,理解了位元組順序在可以幫助我們寫出移植行更高的**.
正因為有位元組順序的差別,所以在網路傳輸的時候定義了所有位元組順序相關的資料都使用big-endian,bsd的**中定義了四個巨集來處
理:#define
ntohs(n)
//網路位元組順序到主機位元組順序 n代表net, h代表host, s代表short
#define
htons(n)
//主機位元組順序到網路位元組順序 n代表net, h代表host, s代表short
#define
ntohl(n)
//網路位元組順序到主機位元組順序 n代表net, h代表host, s代表 long
#define
htonl(n)
//主機位元組順序到網路位元組順序 n代表net, h代表host, s代表 long
舉例說明下這其中乙個巨集的實現:
#define
sw16(x) "
((short
)( "
(((short
)(x) &(
short
)0x00ffu
) <<8)
|"(((short
)(x) &(
short
)0xff00u
) >>
8) ))
這裡實現的是乙個交換兩個位元組順序.其他幾個巨集類似.
我們改寫一下上面的程式
#include
<
stdio.h
>
#include
<
assert.h
>
#define
sw16(x) "
((short
)( "
(((short
)(x) &(
short
)0x00ffu
) <<8)
|"(((short
)(x) &(
short
)0xff00u
) >>
8) ))
//因為x86下面是低位在前,需要交換一下變成網路位元組順序
#define
htons(x) sw16(x)
void
main(
void)
如果在高位元組在前的機器上,由於與網路位元組順序一致,所以我們什麼都不幹就可以了,只需要把#define htons(x) sw16(x)巨集替
換為 #define htons(x) (x).
一開始我在理解這個問題時,總在想為什麼其他資料不用交換位元組順序?比如說我們write一塊buffer到檔案,最後終於想明白了,
因為都是unsigned char型別乙個位元組乙個位元組的寫進去,這個順序是固定的,不存在位元組順序的問題.
【用函式判斷系統是big endian還是little endian】
bool
isbig_endian()
//如果位元組序為big-endian,返回true;
//反之為 little-endian,返回false
//isbig_endian()
【列印程式物件的位元組表示】
//可在不同平台與硬體架構的機器中測試執行這段**,理解大端表示和小端表示的不同.
//這段**使用強制型別轉換規避型別系統
#incluede
<
stdio.h
>
//假設每個位元組都是非負整數
typedef unsigned
char
*byte_pointer;
void
show_bytes(byte_pointer start,
intlen)
void
show_int(
intx)
void
show_float(
float
x)//
在使用相同編碼(如ascii編碼)的系統中,字串位元組表示得到的結果一般是相同的.所以文字資料比二進位制資料具有更強的平台無關性
void
show_string(
char*x)
void
show_pointer(
void*x)
void
test_show_bytes(
intval)
---------------------------------------------
對於如數值12345在int型和float型時的編碼表示
小端法與大端法及驗證機器小端還是大端的驗證程式
首先請看定義 a little endian就是低位位元組排放在記憶體的低位址端,高位位元組排放在記憶體的高位址端。b big endian就是高位位元組排放在記憶體的低位址端,低位位元組排放在記憶體的高位址端。舉例說明 假設變數x型別為int,位於位址0x100處,x的十六進製制表示形式為0x01...
資料的大端小端表示法
在32位小端的機器上,如下 輸出是什麼 char array 12 short pshort short array int pint int array int64 pint64 int64 array printf 0x x 0x x 0x llx 0x llx pshort pshort 2 ...
大端小端儲存的含義及判斷
大端模式 所謂的大端模式 big endian 是指資料的高位元組,儲存在記憶體的低位址中,而資料的低位元組,儲存在記憶體的高位址中,這樣的儲存模式有點兒類似於把資料當作字串順序處理 位址由小向大增加,而資料從高位往低位放 例子 0000430 e684 6c4e 0100 1800 53ef 01...