2018-08-02 0.1+0.2=0.30000000000000004

最近偶然发现了0.1+0.2 = 0.30000000000000004的现实,当然类似于此的还有很多,比如0.7*n结果很多都是一个无限小数,本来以为这是千万个js的坑之一,但是后来发现很多语言都有这个问题,这个问题并不是js的机制所导致的,而是所有语言的浮点数标准IEEE 754所导致的,所以,这篇文章想要大致分享一下探索过程以及究竟为什么会出现这样的情况。

这篇文章的主题就是:垃圾浮点数标准,自带误差,所以算出来不对不能怪电脑!!(好了完了,误)其实看了好久这个,本以为一下午就可以解决的事情,折腾了几天的感觉(当然主要也有工作穿插的原因嘛),最终虽然模模糊糊理解了大致的原因,但是不知道自己能不能真正的解释清楚。嗯嗯,当然浮点数不是垃圾,IEEE 754标准也是集结了前人智慧的,下面进入正题。

分析这个问题,其实需要了解原码,反码,补码等概念,然后会根据这些数码进行二进制的运算,然后再从这些部分延申到二进制浮点数,再逐步分析浮点数的加减。但是这样其实有点繁琐,整理起来也没那么简单,所以我们首先聚焦这个问题:0.1+0.2的结果按道理来说是0.3,但是为什么这里会有溢出呢?我们刚才也说到了IEEE 754标准,那么我关注的就是这个标准,浮点数在这个标准之下是怎样进行存储的,导致了有溢出出现呢?

我们都知道,在计算机之中,所有的数据都是二进制存储的,比如说数字5,二进制表示为101,数字15,二进制表示为1111。而且在计算机中,数字的表示还是有一定格式的,也就是精度。比如,有数据类型的限制是用8位表示,而且又要分正负,那么它的取值范围就是-2^7 ~ 2^7-1(c++中的char类型,就是这样的取值范围,有人可能会疑惑为什么不是-128 ~ 128,这个稍后再讲)。所以如果用这样的类型表示数字,5就是00000101,15就是00001111,采用高位用0补齐的方式存储到内存当中。

那浮点数怎么办呢?诸如20.4,30.67,0.5等等或简单或复杂的小数,我们首先发现的问题是小数位该怎么去表示。我们在中学中有学到整数的表示法可以称为“除2取余法”,比如5/2 = 2 ……1,2/2 = 1……0,1/2 = 0 …… 1,所以5表示为101,这么做的原因就是5可以表示为12^2+021+1*20。那么我们反过来思考小数,是不是也可以表示成2e相加(e为负数)的形式,但是遗憾的是,2-1 = 0.5, 2^-2 = 0.25,不像2的正数次方那么有规律,所以注定有些数我们是表示不了的。但是作为一个完整的运算系统,这些数字我们是不可能舍弃的呀,所以我们只能近似的取到这些数字。

等等,我们好像还没说浮点数该怎么表示,怎么好像已经发现了浮点数会出问题的原因了。其实只想知道大致为什么的同志,到这里就可以over了,其核心原因就是,本身用二进制来表示小数就会难以覆盖,所以采用了一种近似的方式,既然是近似,那么有误差的出现,似乎也没那么奇怪了。下面将结合我的了解和资料的查询分析,探索一下究竟是怎样的二进制存储与运算才导致了这样的情形。

首先就是刚才还未说完的二进制表示浮点数,对于小数部分,我们需要使用“乘2取整法”,例如0.875
0.875*2 = 1.75 整数部分 1
0.75 * 2 = 1.5 整数部分 1
0.5 * 2 = 1.0 整数部分 1

所以0.875的二进制的小数部分表示就是 111,我们逆向计算一下,12^-1 + 12^-2 + 1*2^-3 = 0.875
从理论数据上我们看到,这样做是没错的,虽然我们选择的数据可能有点那么“正正好”。

那么接下来我们就碰到了下一个严峻的问题,小数点怎么办?二进制是没有办法表示小数点的呀,那就轮到我们的IEEE 754登场了。在计算机中,浮点数(此处以单精度float32位为例,当然js使用的也是这一个,在c++等语言中还有双精度double64位,这个位就是刚才我所说的精度的概念)采用了一种特别的方式去保存,在涉及到小数位的时候,你需要先把小数转换为二进制向上面那样,0.875转换成了0.111,然后通过移位让数字的整数部分为1,形成1.xxxxx * 2e的形式,所以0.111就可以表示成1.11*2-1。在IEEE 754之中,浮点数的存储分为三个部分,在各种文献中的解释极其正规的解释了三部分叫做,sign bit,exponent bias,fraction,emmm大致是如下结构

image.png

他们各自的命名是符号为,偏移量(移码,阶码)

注:
原码是一个数的二进制,而反码是这个数对于当前数位的满值的补值。啊,这句话说的我自己都不理解什么意思,举个例子(一下用四位进行表示,一位符号位,三位真值域):

a = 2 (0010)
a取反,a的反码0101,记作b=5
a+b = 0111 = 7,为当前数位的满值,即2^n-1
这个道理其实恰恰印证了模运算的合理性与应用在二进制运算上的正确性

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,047评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,807评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,501评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,839评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,951评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,117评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,188评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,929评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,372评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,679评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,837评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,536评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,168评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,886评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,129评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,665评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,739评论 2 351

推荐阅读更多精彩内容