java.lang.Integer#parseInt() 源码分析

java.lang.Integer#parseInt() 源码分析

Integer#parseInt() 是我们经常使用的一个函数, 是 Integer 类提供的一个静态工具方法, 其作用就是将字符串的数字转换为 int 类型.

一个更通用的 parseInt() 的方法拥有两个参数, 其函数签名定义如下:

public static int parseInt(String s, int radix) throws NumberFormatException {}
  • String s: 待解析的字符串
  • int radix: 进制 (如果不指定这个参数, 默认为 10 进制)

使用范围

这个方法可以合法使用的例子如下:

parseInt("0", 10) returns 0
parseInt("473", 10) returns 473
parseInt("+42", 10) returns 42
parseInt("-0", 10) returns 0
parseInt("-FF", 16) returns -255
parseInt("1100110", 2) returns 102
parseInt("2147483647", 10) returns 2147483647
parseInt("-2147483648", 10) returns -2147483648
parseInt("2147483648", 10) throws a NumberFormatException
parseInt("99", 8) throws a NumberFormatException
parseInt("Kona", 10) throws a NumberFormatException
parseInt("Kona", 27) returns 411787

需要注意的有以下几点:

  1. 可以包括正负数符号 +, -
  2. 对于每个进制的数, 只能包含这个进制所能包含的有效数字, 不然会抛出 NumberFormatException

源码分析

异常检测

if (s == null) {
    throw new NumberFormatException("null");
}

if (radix < Character.MIN_RADIX) {
    throw new NumberFormatException("radix " + radix +
                                    " less than Character.MIN_RADIX");
}

if (radix > Character.MAX_RADIX) {
    throw new NumberFormatException("radix " + radix +
                                    " greater than Character.MAX_RADIX");
}

第一部分完成异常检测, 如果 s 为 null 或者 radix 不在有效范围内, 抛出异常.

有效的进制范围为 2~36, 最小为 2 进制, 最大为 36 进制 (因为有 26 个英文字母, 26 + 10 = 36)

变量定义

在解析过程中, 所使用的变量包括如下:

int result = 0; // 最后返回的解析结果
boolean negative = false; // 标记所解析的数是正数还是负数
int i = 0, len = s.length(); // 解析的下标和字符串总长度 (从左到右进行解析)
int limit = -Integer.MAX_VALUE; // 所能解析数的最大范围
int multmin; // 在解析最后一位数字之前的最大范围
int digit; // 所解析的每一位数字

解析思路说明

在解释上述变量的具体设定之前, 有必要先对解析的思路进行说明.

int 变量正数和负数的范围不一致

int 变量正数和负数的范围是不一致的, int 的范围是 -2^{32} ~ 2^{32} - 1, 即 -2147483648 ~ 2147483647, 正数和负数的范围是不一致的.

我们在解析负数的时候, 是使用一个 intresultbooleannegative 组合来完成最后数值的解析的.

如果我们要解析的数是 -2147483648, 那么, 在解析的过程中, 需要存储一个 2147483648 的值, 那么直接用 int 存储 2147483648, 会发生溢出.

因此这里的解决方案是, 使用负数来进行存储, 避免溢出.

解析代码

解析代码的主体如下:

if (len > 0) {
    char firstChar = s.charAt(0);
    if (firstChar < '0') { // Possible leading "+" or "-"
        if (firstChar == '-') {
            negative = true;
            limit = Integer.MIN_VALUE;
        } else if (firstChar != '+')
            throw NumberFormatException.forInputString(s);

        if (len == 1) // Cannot have lone "+" or "-"
            throw NumberFormatException.forInputString(s);
        i++;
    }
    multmin = limit / radix;
    while (i < len) {
        // Accumulating negatively avoids surprises near MAX_VALUE
        digit = Character.digit(s.charAt(i++),radix);
        if (digit < 0) {
            throw NumberFormatException.forInputString(s);
        }
        if (result < multmin) {
            throw NumberFormatException.forInputString(s);
        }
        result *= radix;
        if (result < limit + digit) {
            throw NumberFormatException.forInputString(s);
        }
        result -= digit;
    }
} else {
    throw NumberFormatException.forInputString(s);
}

上面就是解析代码的主体, 下面来一部分一部分进行分析.

正负符号的解析

第一部分为正负号的解析, 这部分逻辑简单, 其中有很多注释说明的很清楚了.

char firstChar = s.charAt(0); // 获取第一个字符
if (firstChar < '0') { // Possible leading "+" or "-"
    if (firstChar == '-') {
        negative = true;
        limit = Integer.MIN_VALUE; // 如果是负值的话, 重新指定限制范围
    } else if (firstChar != '+')
        throw NumberFormatException.forInputString(s);

    if (len == 1) // Cannot have lone "+" or "-"
        throw NumberFormatException.forInputString(s);
    i++;
}

数值的解析

这部分是数值解析的重点, 基本逻辑很简单, 但是其中有很多很多的坑, 一不留神就会写出有 bug 的代码, 我们细细分析一下.

我们上面已经说明了, 我们使用的是负数进行存储的, 以避免溢出.

multmin = limit / radix; // 指定 multmin 的值, 这个值的作用在下面说明
while (i < len) {
    // Accumulating negatively avoids surprises near MAX_VALUE
    digit = Character.digit(s.charAt(i++),radix); // 调用 Character.digit() 方法进行解析
    if (digit < 0) {
        throw NumberFormatException.forInputString(s);
    }
    if (result < multmin) { // 因为是负值存储, 所以小于说明越界了, 如果当前数值已经超过了 multmin, 那么说明在添加当前数值之前, 就已经越界了, 直接抛出异常. 提前判断一次的原因, 是因为防止下一步越界
        throw NumberFormatException.forInputString(s);
    }
    result *= radix; // 就是因为要进行这一步操作, 所以要在更新 result 值之前, 先比较 result 和 multmin, 如果已经越界了, 那么再进行这一步操作, 就会越界
    if (result < limit + digit) { // 判断增加了当前值之后, 会不会越界
        throw NumberFormatException.forInputString(s);
    }
    result -= digit; // 添加当前数值, 注意我们是使用负数存储的, 通过上面的代码, 保证到这一步一定不会发生溢出.
}

细节说明

multmin 的使用

为什么要多此一举的使用 multmin 呢?

在下面的代码中, multmin 的取值为:

multmin = limit / radix;

下面举例说明 multmin 的使用原因.

为去除最后一位数之后的最大范围, 例如, limit 取 -2147483648, radix 为 10 , multmin 的值为 -214748364, 为去除最后一位数之后的最大取值.

如果所解析的数为 2147483659, 超过了最大范围, 去除最后一位之后, result 的值为 -214748365, 这时, 如果再执行 result *= radix, 那么会得到 -2147483650, 就已经越界了, result 的值就不再正确了. 而提前比较了 multmin 值, 就能提前判断, 提前抛出异常.

比较 result < limit + digit
if (result < limit + digit) { // 判断增加了当前值之后, 会不会越界
    throw NumberFormatException.forInputString(s);
}

上述逻辑判断的是, result 加上当前数值之后, 会不会发生越界, 最朴素的思路是, result - digit 是不是小于 limit, 即写成 result - digit < limit.

这里有个坑就是, 如果写成上面的样子, 会发生溢出, 因为 result - digit 会产生溢出, 但是我们移项过去之后, result < limit + digit 就没有问题.

总结

看似解析数值非常简单, 但是里面的坑真的是非常多, 我们可以好好学一下这个代码, 避免很多数值溢出的坑, 对我们以后写代码也会有很好的学习作用.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,874评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,102评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,676评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,911评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,937评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,935评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,860评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,660评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,113评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,363评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,506评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,238评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,861评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,486评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,674评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,513评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,426评论 2 352

推荐阅读更多精彩内容