最近偶然发现了0.1+0.2 = 0.30000000000000004的现实,当然类似于此的还有很多,比如0.7*n结果很多都是一个无限小数,本来以为这是千万个js的坑之一,但是后来发现很多语言都有这个问题,这个问题并不是js的机制所导致的,而是所有语言的浮点数标准IEEE 754所导致的,所以,这篇文章想要大致分享一下探索过程以及究竟为什么会出现这样的情况。
这篇文章的主题就是:垃圾浮点数标准,自带误差,所以算出来不对不能怪电脑!!(好了完了,误)其实看了好久这个,本以为一下午就可以解决的事情,折腾了几天的感觉(当然主要也有工作穿插的原因嘛),最终虽然模模糊糊理解了大致的原因,但是不知道自己能不能真正的解释清楚。嗯嗯,当然浮点数不是垃圾,IEEE 754标准也是集结了前人智慧的,下面进入正题。
分析这个问题,其实需要了解原码,反码,补码等概念,然后会根据这些数码进行二进制的运算,然后再从这些部分延申到二进制浮点数,再逐步分析浮点数的加减。但是这样其实有点繁琐,整理起来也没那么简单,所以我们首先聚焦这个问题:0.1+0.2的结果按道理来说是0.3,但是为什么这里会有溢出呢?我们刚才也说到了IEEE 754标准,那么我关注的就是这个标准,浮点数在这个标准之下是怎样进行存储的,导致了有溢出出现呢?
我们都知道,在计算机之中,所有的数据都是二进制存储的,比如说数字5,二进制表示为101,数字15,二进制表示为1111。而且在计算机中,数字的表示还是有一定格式的,也就是精度。比如,有数据类型的限制是用8位表示,而且又要分正负,那么它的取值范围就是-2^7 ~ 2^7-1(c++中的char类型,就是这样的取值范围,有人可能会疑惑为什么不是-128 ~ 128,这个稍后再讲)。所以如果用这样的类型表示数字,5就是00000101,15就是00001111,采用高位用0补齐的方式存储到内存当中。
那浮点数怎么办呢?诸如20.4,30.67,0.5等等或简单或复杂的小数,我们首先发现的问题是小数位该怎么去表示。我们在中学中有学到整数的表示法可以称为“除2取余法”,比如5/2 = 2 ……1,2/2 = 1……0,1/2 = 0 …… 1,所以5表示为101,这么做的原因就是5可以表示为12^2+021+1*20。那么我们反过来思考小数,是不是也可以表示成2e相加(e为负数)的形式,但是遗憾的是,2-1 = 0.5, 2^-2 = 0.25,不像2的正数次方那么有规律,所以注定有些数我们是表示不了的。但是作为一个完整的运算系统,这些数字我们是不可能舍弃的呀,所以我们只能近似的取到这些数字。
等等,我们好像还没说浮点数该怎么表示,怎么好像已经发现了浮点数会出问题的原因了。其实只想知道大致为什么的同志,到这里就可以over了,其核心原因就是,本身用二进制来表示小数就会难以覆盖,所以采用了一种近似的方式,既然是近似,那么有误差的出现,似乎也没那么奇怪了。下面将结合我的了解和资料的查询分析,探索一下究竟是怎样的二进制存储与运算才导致了这样的情形。
首先就是刚才还未说完的二进制表示浮点数,对于小数部分,我们需要使用“乘2取整法”,例如0.875
0.875*2 = 1.75 整数部分 1
0.75 * 2 = 1.5 整数部分 1
0.5 * 2 = 1.0 整数部分 1
所以0.875的二进制的小数部分表示就是 111,我们逆向计算一下,12^-1 + 12^-2 + 1*2^-3 = 0.875
从理论数据上我们看到,这样做是没错的,虽然我们选择的数据可能有点那么“正正好”。
那么接下来我们就碰到了下一个严峻的问题,小数点怎么办?二进制是没有办法表示小数点的呀,那就轮到我们的IEEE 754登场了。在计算机中,浮点数(此处以单精度float32位为例,当然js使用的也是这一个,在c++等语言中还有双精度double64位,这个位就是刚才我所说的精度的概念)采用了一种特别的方式去保存,在涉及到小数位的时候,你需要先把小数转换为二进制向上面那样,0.875转换成了0.111,然后通过移位让数字的整数部分为1,形成1.xxxxx * 2e的形式,所以0.111就可以表示成1.11*2-1。在IEEE 754之中,浮点数的存储分为三个部分,在各种文献中的解释极其正规的解释了三部分叫做,sign bit,exponent bias,fraction,emmm大致是如下结构
他们各自的命名是符号为,偏移量(移码,阶码)
注:
原码是一个数的二进制,而反码是这个数对于当前数位的满值的补值。啊,这句话说的我自己都不理解什么意思,举个例子(一下用四位进行表示,一位符号位,三位真值域):
a = 2 (0010)
a取反,a的反码0101,记作b=5
a+b = 0111 = 7,为当前数位的满值,即2^n-1
这个道理其实恰恰印证了模运算的合理性与应用在二进制运算上的正确性