大小端问题

什么是大小端?

大端模式,是指数据的高字节保存在内存的低地址中,而数据的低字节保存在内存的高地址中,这样的存储模式有点儿类似于把数据当作字符串顺序处理:地址由小向大增加,而数据从高位往低位放;这和我们的阅读习惯一致。

小端模式,是指数据的高字节保存在内存的高地址中,而数据的低字节保存在内存的低地址中,这种存储模式将地址的高低和数据位权有效地结合起来,高地址部分权值高,低地址部分权值低。

要注意一点,也就是,这里的高字节和低字节与高地址和低地址是两个截然不同的概念。习惯上,将一个数字按位写到纸上时,我们会从左至右,从高位到低位一位一位地写,这是一种具体的行为。在谈到一个多字节整型数据的高低字节时,我们并没有考虑它如何进行存储,而是按照人类的习惯,将权值高的字节称作高字节,权值地的称作低字节。

大小端模式的判断

Linux 源码中判断大小端模式的方法

static union {
    int i;
    char c[4];
} endian_test = {{'l', '?', '?', 'b'}};

#define ENDIANNESS ((char)endian_test.i)

理解上面的代码的关键是,

int -> char 的转换要截断到int的最后一个字节(只保留低8位)。
字符串不用考虑大小端模式的问题,从左至右内存地址依次增高

+---+---+---+---+
| l | ? | ? | b +
+---+---+---+---+
  • 如果是小端模式,那么低字节保留在低地址,而这里如果按char来寻址,低地址也即是最左边的那个字节,其中存储了'l'

  • 如果是大端模式,那么低字节保留在高地址,而这里如果按char来寻址,高地址也即是最右边的那个字节,其中存储了'b'

什么时候需要判断大小端模式?
一般情况下,只有需要跟硬件直接打交道的地方才需要自己去判断大小端,其余的地方编译器和操作系统会帮你搞定,比如对多字节数据类型进行按位运算。另外,网络传输数据的时候是按照字节传输的,这时候就需要考虑字节序。

一个简单的例子

#include <stdio.h>
#include <stdlib.h>

static union {
    int i;
    char c[4];
} endian_test = {{'l', '?', '?', 'b'}};

#define ENDIANNESS ((char)endian_test.i)


void printbyte(char byte)
{
    for (int i = 0; i < 8; ++i)
        putchar('0' + ((byte >> (7 - i)) & 0x1));
}

// 从高字节到低字节,高位到低位
void print_int4b(int x)
{
    const char *s = (char *)&x;
    if (ENDIANNESS == 'l') {
        for (int i = 3; i >= 0; --i)
            printbyte(s[i]);
    }
    else if (ENDIANNESS == 'b') {
        for (int i = 0; i <= 3; ++i)
            printbyte(s[i]);
    }
    else {
        fprintf(stderr, "%s\n", "unknown endianness");
        exit(1);
    }
    putchar('\n');
}

void print_int32(int x)
{
    for (int i = 0; i < 32; ++i)
        putchar('0' + ((x >> (31 - i)) & 0x1));
    putchar('\n');
}


int main()
{
    int i = 100;
    print_int4b(i);
    print_int32(i);

    return 0;
}
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1、大小端问题的由来 在计算机内存中,通常是以字节(Byte),也就是 8 个位(Bit)为基本存储单元(也有以 ...
    姚兴泉阅读 2,794评论 0 3
  • 一、定义 大端模式:大端模式就是指把数据的高字节保存在内存的低地址中,数据的低字节保存在内存的高地址中,这和我们一...
    rmrfany阅读 1,468评论 0 2
  • 在几乎所有的机器上,多字节对象都被存储为连续的字节序列。例如在C语言中,一个类型为int的变量x地址为0x100,...
    董江鹏阅读 1,319评论 0 0
  • 如果将一个32位的整数0x12345678存放到一个整型变量(int)中,这个整型变量采用大端或者小端模式在内存中...
    hailiu13阅读 696评论 0 0
  • __block和__weak修饰符的区别其实是挺明显的:1.__block不管是ARC还是MRC模式下都可以使用,...
    LZM轮回阅读 3,400评论 0 6