字节序(Endian),大端(Big-Endian),小端(Little-Endian)

简介:

在各种计算机体系结构中,对于字节、字等的存储机制有所不同,因而引发了计算机通信领域中一个很重要的问题,即通信双方交流的信息单元(比特、字节、字、双字等等)应该以什么样的顺序进行传送。如果不达成一致的规则,通信双方将无法进行正确的编/译码从而导致通信失败。目前在各种体系的计算机中通常采用的字节存储机制主要有两种:

big-edianlittle-endian

 

 

字节顺序 Endian

现代的计算机系统一般采用字节(Octet, 8 bit Byte)作为逻辑寻址单位。当物理单位的长度大于1个字节时,就要区分字节顺序(Byte Order, or Endianness)。常见的字节顺序有两种:Big Endian(High-byte first)和Little Endian(Low-byte first),这就是表2.1中的BELE。Intel X86平台采用Little Endian,而PowerPC处理器则采用了Big Endian。举例来说,整型数字$1234ABCD存储的时候就会有两种方式:

字节顺序

内存数据

备注

Big Endian (BE)

0xAB 0xCD 0x12 0x34

此时的0xAB被称为most significant byte (MSB)

Little Endian (LE)

0xCD 0xAB 0x34 0x12

此时的0xCD被称为least significant byte (LSB)

 

词源:据Jargon File记载,endian这个词来源于Jonathan Swift1726年写的讽刺小说 "Gulliver's Travels"(《格利佛游记》)。该小说在描述Gulliver畅游小人国时碰到了如下的一个场景。在小人国里的小人因为非常小(身高6英寸)所以总是碰到一些意想不到的问题。有一次因为对水煮蛋该从大的一端(Big-End)剥开还是小的一端(Little-End)剥开的争论而引发了一场战争,并形成了两支截然对立的队伍:支持从Big-End剥开的人Swift就称作Big-Endians而支持从Little-End剥开的人就称作Little-Endians……(后缀ian表明的就是支持某种观点的人:-)。Endian这个词由此而来。

  1980年,Danny Cohen在其著名的论文"On Holy Wars and a Plea for Peace"中为了平息一场关于在消息中字节该以什么样的顺序进行传送的争论而引用了该词。该文中,Cohen非常形象贴切地把支持从一个消息序列的MSB开始传送的那伙人叫做Big-Endians,支持从LSB开始传送的相对应地叫做Little-Endians。此后Endian这个词便随着这篇论文而被广为采用。

Mapping registers to memory locations

 

 

最高有效位 MSB: Most Significant Bit

       最高有效位(MSB),有时候叫做最左边的位,是在一个n位二进制数字中的n-1位,这个位有最高的权重(2^(n-1))。第一个或最左边的位,当这个数字被用一般的方式书写时。

 

 

最低有效位 LSB: Least Significant Bit

       最低有效位(LSB)是给这些单元值的一个二进制整数位位置,就是,决定是否这个数字是偶数或奇数。LSB有时候是指最右边的位,因为写较不重要的数字到右边位置符号的协定。它类似于一个十进制整数的最不重要的数字,它是在一个(最右边)位置的数字。

 

 

大端Big-Endian

低地址存放最高有效位(MSB),既高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。

计算机体系结构中一种描述多字节存储顺序的术语,在这种机制中最高有效位(MSB)存放在最低端的地址上。采用这种机制的处理器有IBM3700系列、PDP-10Mortolora微处理器系列和绝大多数的RISC处理器。

 

 

小端Little-Endian

       低地址存放最低有效位(LSB),既低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。

计算机体系结构中一种描述多字节存储顺序的术语,在这种机制中最不重要字节(LSB)存放在最低端的地址上。采用这种机制的处理器有PDP-11VAXIntel系列微处理器和一些网络通信设备。该术语除了描述多字节存储顺序外还常常用来描述一个字节中各个比特的排放次序。

 

 

中端 Middle-Endian

除了big-endianlittle-endian之外的多字节存储顺序就是middle-endian,比如以4个字节为例:象以3-4-1-2或者2-1-4-3这样的顺序存储的就是middle-endian。这种存储顺序偶尔会在一些小型机体系中的十进制数的压缩格式中出现。

 

 

网络字节序 Network Order

TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序。

 

 

主机序 Host Orader

它遵循Little-Endian规则。所以当两台主机之间要通过TCP/IP协议进行通信的时候就需要调用相应的函数进行主机序(Little-Endian)和网络序(Big-Endian)的转换。

 

 

C++怎样判别大端小端

使用宏的方法:

None.gif const  int endian = 1;
None.gif
None.gif #define is_bigendian() ( (*(char*) &endian) == 0 )
None.gif
None.gif #define is_littlendbian() ( (*(char*) &endian) == 1 )
None.gif
None.gif

 方法二:

None.gif bool    IsLittleEndian()
None.gif
ExpandedBlockStart.gif{
InBlock.gif
InBlock.gifunion   
InBlock.gif
ExpandedSubBlockStart.gif{    
InBlock.gif
InBlock.gif long    val;
InBlock.gif
InBlock.gif char    Char[ sizeof( long)];
InBlock.gif
ExpandedSubBlockEnd.gif}u;
InBlock.gif
InBlock.gif //     1-小端(Intel);    0-大端(Motor)
InBlock.gif

InBlock.gifu.val = 1;  
InBlock.gif
InBlock.gif if ( u.Char[0] == 1 )
InBlock.gif
ExpandedSubBlockStart.gif{
InBlock.gif
InBlock.gif //  小端
InBlock.gif

InBlock.gif return  true;
InBlock.gif
ExpandedSubBlockEnd.gif}  
InBlock.gif
InBlock.gif else  if ( u.Char[ sizeof( long)-1] == 1 )
InBlock.gif
ExpandedSubBlockStart.gif{
InBlock.gif
InBlock.gif //  大端
InBlock.gif

InBlock.gif return  false;  
InBlock.gif
ExpandedSubBlockEnd.gif
InBlock.gif
InBlock.gif throw( "Unknown!" );
InBlock.gif
ExpandedBlockEnd.gif}
None.gif
None.gif

 

 

小知识

    Java使用的是Big-Endian

目录
相关文章
|
4月前
|
存储
计算机存储,字节分为大端和小端
计算机存储,字节分为大端和小端
35 1
|
3月前
|
存储 网络协议 API
大端与小端概念、多字节之间与单字节多部分的大小端转换详解
大端与小端概念、多字节之间与单字节多部分的大小端转换详解
62 1
|
7月前
|
存储
大端法与小段法的区别
大端法与小段法的区别
96 0
|
9月前
|
存储
【计算机基础】 --- LSB、MSB与大/小端字节序
【计算机基础】 --- LSB、MSB与大/小端字节序
320 0
|
存储 小程序 编译器
大小端字节序详解
在开始正文之前,我想先问一下大家,内存中是怎样存放一个数的?当然啊,我这里问的不是数据存储的形式(比如整数存原码,负数存补码),而是一个数据存放的顺序 我们先看下面这个例子,当我们看看当把十六进制函数0x11223344存进内存中会是怎么样的。
大小端字节序详解
大端和小端模式
大端和小端模式
|
存储
大端模式、小端模式、高字节序、低字节序、MSB、LSB
你知道内存是怎么读取数据的吗?知道数据是怎么一个一个字节发送的吗?是低字节先发还是高字节先发?是bit0先发还是bit7先发?是从低地址开始读还是从高地址开始读?看完本篇比应该就明白了~
978 0
大端模式、小端模式、高字节序、低字节序、MSB、LSB
|
存储 Java C++
大端(Big Endian)与小端(Little Endian)简介与实现
【大端(Big Endian)与小端(Little Endian)简介】Byte Endian是指字节在内存中的组织,所以也称它为Byte Ordering,或Byte Order。     对于数据中跨越多个字节的对象,我们必须为它建立这样的约定: (1) 它的地址是多少? (2) 它的字节在内存中是如何组织的?     针对第一个问题,有这样的解释:     对于跨
2160 0
|
存储 网络协议 Unix
大端小端(Big- Endian和Little-Endian)探究
字节序,顾名思义字节的顺序,再多说两句就是大于一个字节类型的数据在内存中的存放顺序(一个字节的数据当然就无需谈顺序的问题了)。其实大部分人在实际的开发中都很少会直接和字节序打交道。唯有在跨平台以及网络程序中字节序才是一个应该被考虑的问题。
587 0