浮点数在计算机中是如何表示的?
学过《计算机组成原理》或者类似《计算机系统》这些课程的小伙伴们应该都知道,浮点数在计算机中的存储方式遵循IEEE 754 浮点数计数标准,可以表示为:
采用尾数 + 阶码的编码方式,更通俗一点说,就是类似于数学课本上所学的科学计数法表示方式:有效数字 + 指数位!
因此,只要给出:符号(S)、阶码部分(E)、尾数部分(M)这三个维度的信息,一个浮点数的表示就完全确定下来了,所以float和double这两种类型的浮点数在计算机中的存储结构就表示成下图所示这个样子:
1、符号部分(S)
0-正1-负
2、阶码部分(E)(指数部分):
对于float型浮点数,指数部分8位,考虑可正可负,因此可以表示的指数范围为-127 ~ 128
对于double型浮点数,指数部分11位,考虑可正可负,因此可以表示的指数范围为-1023 ~ 1024
3、尾数部分(M):
浮点数的精度是由尾数的位数来决定的:
对于float型浮点数,尾数部分23位,换算成十进制就是2^23=8388608,所以十进制精度只有6 ~ 7位;
对于double型浮点数,尾数部分52位,换算成十进制就是2^52 = 4503599627370496,所以十进制精度只有15 ~ 16位
所以,浮点数交给计算机存储的时候,可能会有精度丢失问题!!!因此使用时需要格外小心,如果真因为这一块出了bug,定位问题还是非常艰难的,所以预防工作要做好。
进制转换计算案例
上面说的是IEEE标准规定的内容,属于理论规约。那一个小数到底要怎么换算成二进制呢?我们得拿实际例子来解释。
先来个简单的例子
比如:把十进制小数0.875转换成二进制,具体怎么操作?
可以分几大步走:
1、以小数点为界,拆分
2、整数部分转换
整数转二进制我想大家应该都熟悉,使用:除2取余法即可。而这里的0.875整数部分为0,无需操作。
3、小数部分转换
小数部分的转换不同于整数部分,采用的是“乘2取整法”,图示一下就明白了:
4、合并结果
整数部分 + 小数部分,最终得到二进制结果为0.111。
所以该结果按照上一节所述的尾数 + 阶码的计算机计数方式,则可以表示为:
所以对应可得:
符号位:0
阶码(E)部分:若以float为例,应为127 +(-1)= 126,因此二进制表示为:01111110
尾数部分(M):若以float为例,应为23位,因此尾部补齐后为11000000000000000000000。
因此最终的总结果为(以32位精度float表示):
00111111011000000000000000000000
再来个复杂点例子
再比如:把十进制小数6.36转换成二进制,具体怎么操作?
但凡能用图示,我就不想写文字,所以用一张图就可以解释得明明白白:
整数部分 + 小数部分,因此最终得到的结果二进制结果为110.01011100...。
还是按照上一节所述的尾数 + 阶码的计算机计数方式,则可以表示为:
所以对应可得:
符号位:0
阶码(E)部分:若以float为例,应为127 +(2)= 129,因此二进制表示为:10000001
尾数部分(M):1001011100...,其实它本身无限不循环,但若以float型精度来截取23位,则可以表示为10010111000010100011111
因此最终的总结果为(以32位精度float表示):
01000000110010111000010100011111
所以像这种无限位数的尾数情况,用计算机存储产生截取是必然的,必定会有一定的精度损失!所以这也从根本上解释了为什么float或者double这种类型数据使用时的风险性,因此必须要结合实际业务理性考量。
还有一个神器
大家如果对上面的计算结果不放心,或者想检查手动换算的结果是否正确,也有直接的这种二进制转换工具站,典型的比如:binaryconvert.com
不想手动换算的,直接去上面输入,转换一下即可得到结果,而且可以进制互换:
参考:CodeSheep