斯坦福编程范式第二课笔记(数据类型在内存中的表示)

斯坦福编程范式第二课笔记(数据类型在内存中的表示)

内存的最小单位是字节,一个字节等于8位(bit),每一位要么是0要么是1,也就是用二进制来表示。

一个字节在内存中的表示为:

image

无符号整数的表示

无符号二进制转成十进制公式:

image
  • w:二进制位的长度。
  • i:二进制位从右往左开始的下标,从0开始计数。
  • w-1:由于i是从0开始计数,所以最后一个下标就是w-1。
  • x(i):第i位的值,要么是0要么是1。
  • 2^i:2的第i次幂。

例如:
无符号二进制数10010 按照公式展开就是:

image

如果把这个数用1个字节在计算机中存储,内存中就表示为:

image

不足8位,左边补0。

1个字节的无符号正式能表示2^8 = 256个不同的数。能表示最大的数是8个二进位全是1的数等于255,也就是求一个公比为2首项是1等比数列前8项和。二进制位求和公式为(2^n) - 1。总结下来一个n位的二进制数能表示最大的数是(2^n) - 1,能够表示2^n个不同的数,之所以是2^n个不同的数,是因为可以表示0~(2^n) - 1,从0开始的所以还需要+1个长度。

Char在内存中的表示

Char类型是用来存储单个字符,在内存中占用1个字节的大小,它使用8个bit来表示256个字符。
Char类型实际存储的是字符的ASCII码,由于ASCII码是整数。所以Char最终在内存中是一个8bit的整型。

比如字符AASCII码是65,65 = 2^0 + 2^6,所以在内存中的表示为:

image

char ch = 'A';
printf("%d", ch); // output is 65

Short在内存中的表示

Short 表示的是短整型,一般占用2个字节的内存大小。

它的取值范围是(-2)^15~(2^15)-1包含0。最大值这里是(2^15)-1,是因为short有符号位,需要用最高位(用从左到右第一位)来表示符号,0表示正数,1表示负数。 最大值的二进制表示为0111111111111111(16个二进制位),十进制就是(2^15)-1。 之所以是(2^15)-1,也是之前说的求和公式((2^n)-1

实现加减法

二进制加减法和十进制一样,把对应相加,大于1就向前进位。例如0111 + 1 = 1000

如果想要把7和-7相加使结果等于0。按照在计算机中使用二进制的最高位来当做符号位的,0表示正数,1表示负数。那么7表示为0000111,-7就表示为1000111 。0000111 + 1000111 按照二进制先前的加法法则得出来是1001110,结果不是我们想要的0。

怎么才能让2个二进制数相加得到0呢?

想要得到0,就需要利用进位,比如在11111111(8个1)的基础上加1就可以得到100000000(一共9位,左边第一位是1,后面8个0) ,舍掉最左边的那个1就得到了8个0最终结果就等于0。把原码按位取反然后与原码相加就可以得到全1的二进制数。比如0000111按位取反就是1111000,他们俩相加得到11111111。 再把它加1就得到最后的结果0。整个过程需要3步,我们把最后两步合并成一个步骤,也就是把按位取反和加1合并到一起,其实就是把原码的反码加1。如1111000加1得到1111001。最后这两步合在一起叫做取原码的补码。最后得到的1111001就叫做0000111的补码。

  • 正整数的补码是其本身。
  • 负整数的补码是把它对应的正整数二进制码按位取反,也就做原码的反码然后再加1。

比如正整数7的二进制码是0000111,它的补码还是它本身。再比如-7对应的正整数二进制码是0000111,它的反码就是1111000(把原码按位取反)。然后再加1就得到11110011111001就是-7的补码。我们再次把11110010000111按照二进制加法法则相加刚好得到0。这里需要注意的是,这里左边会产生一个溢出位,这个溢出位是去掉不要的,得到结果就是0。

-1的补码全是1,因为它加上1之后就变成了0。

计算机系统都是用补码来表示二进制码,这样的好处之一就是可以让加减法运算统一处理。

位模式拷贝

当把char类型的变量赋值给short类型的变量时,会把char的8个bit放在short的低八位(从右往左第一个字节)上。

例如:

char ch = 'A'; // 'A' ASCII:65 内存表示为 01000001
short s = ch; // 内存表示为 00000000 | 01000001

一个特殊的情况就是当把一个short-1赋值给一个int变量的时候,并不会得到00000000 | 00000000 | 11111111 | 11111111,因为如果这样的话表示的值就不是-1了。所以正确的做法就是把所有的1全部拷贝给int
例如:

short s = -1; // 内存表示为 11111111 | 11111111
int i = s; // 内存表示为 11111111 | 11111111 | 11111111 | 11111111

相反如果把short类型的变量赋值给char类型的变量时,会把short的低八位(从右往左第一个字节)放在char仅有的一个字节上。会把多的字节自动剔除。
例如:

short s = 65; // 内存表示为 00000001 | 01000001
char ch = s; // 内存表示为 01000001

浮点数的表示

我们已经知道无符号二进制转成十进制公式为:

image

这里的i是从0开始的也就是从右边的第一位是2^0,如果我们从一个负整数开始的话,就会存在负整数次幂,那么也就会出现小数部分了。
例如有一个16位的二进制数000000011 | 11000000 用它的前八位来表示整数部分,后八位来表示小数部分,就也可以这样表示000000011.11000000。这样后八位也就不再是整数次幂了,而是从左到右每一位分别是2^(-1)~2^(-8)。这个数就可以表示成:

image

这是其中一种浮点数表示方法,这种方法表示的浮点数会出现精度不够,表示的数值区间比较小,所以计算机实际并没有用该方法来表示浮点数。

下面这种方法就是计算机内部真实表示浮点数的方法。

我们先来看下十进制的科学计数法,用科学计数法表示123.45的话就是1.2345 * 10^2。其中1.2345 为尾数,10为基数,2为指数。计算机在表示浮点数的时候,也借用了十进制的科学计数法的思想,只不过基数为2了。

例如1000.01 可以表示成1.00001 * 2^3,几次幂,小数点就向右移动几位。

32位float来举例,首位是符号位S,紧跟后面8位是指数位E,最后23位称为尾数位M

计算公式:

image
  • S:符号位

S为0时刚好是正数,为1时是负数。

  • M:尾数部分

它的取值范围是1≤M<2,取值方式是从左到右每一位分别表示的是2^-1~2^-23,值就是然后对各个位的表示值求和,这里跟先前浮点数表示的办法一致,都是从负整数次幂开始。由于尾数的整数部分始终都是1,所以这个1可以被省略,这样就可以多出一位来提升精度。

  • E:指数部分

减去127是因为偏移量是127。

例如0 | 10000010 | 11110000000000000000000的每一部分别是:

  • S:0

表示整数。

  • M:11110000000000000000000

这里需要再加1,因为为了提升小数精度省略了1,所以要加回来。所以完整的尾数部分应该是1.1111(省略了后面的0)。 2^0 + 2^-1 + 2^-2 + 2^-3 + 2^-4 = 1.9375

  • E:10000010

2^7 + 2^1 = 130

分别带入公式得:

二进制形式:

image

十进制形式:

image

详细过程:
1 * 1.1111 * 2^(130-127) => 1 * 1.1111 * 2^3 => 1 * 1111.1(几次幂,小数点就向右移动几位) => 1 * (2^3 + 2^2 + 2^1 + 2^0 + 2^-1) => 1 * (8 + 4 + 2 + 1 + 0.5) => 15.5

浮点数与整数相互赋值

当我们在把浮点数与整数相互赋值的时候,并不会直接拷贝bit位,而是重新计算出在新的类型中的位模式。
例如:

int i = 5; // 内存表示 00000000 | 00000000 | 00000000 | 00000101
// 重新计算5在float中的表示方式
float f = i; // 内存表示 0 | 00000000 | 00000000000000000000101
printf("%f", f) // output is 5.0

来一点更刺激的!!!

// 2^30
int i = 1073741824; // 内存表示 01000000 | 00000000 | 00000000 | 00000000
// 这里就不会重新计算在float中的表示方式了,而是直接把bit位拷贝过去。用float的解析方式去解析int的那块内存。
float f = *(float *)&i; // 内存表示 0 | 10000000 |00000000000000000000000

// 1 * 2^(128-127) * 1 = 2
printf("%f", f) // output is 2.0

这里就不会重新计算1073741824在float中的表示方式了,而是直接把intbit位拷贝过去。用float的解析方式去解析int的那块内存

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,864评论 6 494
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,175评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,401评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,170评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,276评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,364评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,401评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,179评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,604评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,902评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,070评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,751评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,380评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,077评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,312评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,924评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,957评论 2 351

推荐阅读更多精彩内容