[转]位域与字节序解析
==============================================
如下代码
- #include “stdio.h”
- struct kk
- {
- unsigned a:2;
- unsigned b:3;
- unsigned c:2;
- unsigned d:1;
- }
- kt;
- int main()
- {
- char result =3;
- memcpy(&kt,&result,1);
- printf(” a = %d, b = %d, c = %d, d = %d,ok/n”,kt.a,kt.b,kt.c,kt.d);
- return 1;
- }
在sun unix上用cc编译,结果为0,0,1,1
在2000上用VC6.0编译,结果为3,0,0,0
=================================================
解释一下,呵呵:
C语言的位域虽然很多人强烈建议不要使用,但现有系统里还广泛存在位域的使用,所以还是很有必要理清楚的。
对big-endian和little-endian的区别,很多人认为是对多字节数据类型而言。其实,问题的本质不在这里。
两种endian区别的本质是由于CPU的数据引脚和系统地址总线的连接方向的不同。也就是说,高地址,低地址的区别不仅体现在“字节序”上,还体现在“比特序”上,只不过因为系统屏蔽了“比特序”的一些细节,所以看起来问题仅仅是字节之间的顺序问题了。
所以,对字节序相关的问题,如果能从两个角度来看问题,就很直接明了了。
先从系统地址总线的角度来分析数据的存放,然后从CPU的数据引脚的角度来解析数据….(对网络字节,可从网络数据传送地址的角度分析数据的存放,思想类同)
废话少说,分析一下上面的例子程序。(所有图表都从系统地址总线的角度看各个bit位)
C语言的位域中,每个field是严格按照bit地址从低到高排列的:
因此,从地址总线的角度看,四个域的排列顺序是(用于解析)
==============
-低->->->高-
a b c d
==============
接下来看如何解析这个字节。
在little-endian机器上,result字节中各个比特的存放排列如下所示
==============
-低->->->高-
,11000000,
==============
对应到四个位域,得
a=3
b=0
c=0
d=0
在big-endian机器上,result字节中各个比特的存放排列如下所示
==============
-低->->->高-
,00000011,
==============
对应到四个位域,得
a=0
b=0
c=1
d=1
总结:
1. C语言的位域类型使用时,各个field的摆放是按从低到高的bit顺序排列的。
2. 把数据的存放和解析分开,就可以很容易解释字节序的问题。
是这样的。这里有个术语的混淆。当多个字节组成一个长字(long)时,不同体系结构的cpu会按不同的方法来解释高低字节的顺序,这是字节序。小端的cpu会将低地址的字节认为是长字值的低位,高地址的字节认为是长字值得高位。大端的正好相反。
而在一个字节之内,不同体系结构的cpu会按不同的方法来解释高低比特的顺序,这是比特序。 小端的cpu将低位的比特认为是值得低位,高位的比特认为是值得高位。大端的正好相反。假设固定总线上的比特地址,从0比特到7比特的内存数据是 0 0 0 0 0 0 0 1。那么,小端的cpu读到的值就是0x80,而大端的cpu读到的值就是0x01。
INTEL的cpu字节序和比特序都是小端的。POWERPC的cpu一般都是大端的.
明白以上道理,你可以分析IP header了.
- struct iphdr
- {
- #if __BYTE_ORDER == __LITTLE_ENDIAN
- unsigned int ihl:4;
- unsigned int version:4;
- #elif __BYTE_ORDER == __BIG_ENDIAN
- unsigned int version:4;
- unsigned int ihl:4;
- #else
- # error “Please fix <bits/endian.h>”
- #endif
- u_int8_t tos;
- u_int16_t tot_len;
- u_int16_t id;
- u_int16_t frag_off;
- u_int8_t ttl;
- u_int8_t protocol;
- u_int16_t check;
- u_int32_t saddr;
- u_int32_t daddr;
- /*The options start here. */
- };
以及 tcp header
- struct tcphdr
- {
- u_int16_t source;
- u_int16_t dest;
- u_int32_t seq;
- u_int32_t ack_seq;
- # if __BYTE_ORDER == __LITTLE_ENDIAN
- u_int16_t res1:4;
- u_int16_t doff:4;
- u_int16_t fin:1;
- u_int16_t syn:1;
- u_int16_t rst:1;
- u_int16_t psh:1;
- u_int16_t ack:1;
- u_int16_t urg:1;
- u_int16_t res2:2;
- # elif __BYTE_ORDER == __BIG_ENDIAN
- u_int16_t doff:4;
- u_int16_t res1:4;
- u_int16_t res2:2;
- u_int16_t urg:1;
- u_int16_t ack:1;
- u_int16_t psh:1;
- u_int16_t rst:1;
- u_int16_t syn:1;
- u_int16_t fin:1;
- # else
- # error “Adjust your <bits/endian.h> defines”
- # endif
- u_int16_t window;
- u_int16_t check;
- u_int16_t urg_ptr;
- };