JDK6/7/8/9中的String类

String类是在做Java开发时最常用的一个类，因此在JDK6，7/8，9中分别对String类进行了优化。本文将结合源码介绍JDK6，7/8，9中，String类分别做了哪些优化，以及String类在创建对象时分别会在哪创建出对象。

一、String类在JDK6，7/8，9中的实现

1. JDK6中的String类

源码

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence
{
    /** The value is used for character storage. */
    private final char value[];

    /** The offset is the first index of the storage that is used. */
    private final int offset;

    /** The count is the number of characters in the String. */
    private final int count;
    ...
}

构造一个String对象所对应的内存结构

image.png

想象一种场景，假设我执行了

String B  = A.substring(2, 4);
String A = null;

根据substring以及String构造函数的源码

public String substring(int beginIndex, int endIndex) {
    if (beginIndex < 0) {
        throw new StringIndexOutOfBoundsException(beginIndex);
    }
    if (endIndex > count) {
        throw new StringIndexOutOfBoundsException(endIndex);
    }
    if (beginIndex > endIndex) {
        throw new StringIndexOutOfBoundsException(endIndex - beginIndex);
    }
    return ((beginIndex == 0) && (endIndex == count)) ? this :
        new String(offset + beginIndex, endIndex - beginIndex, value);
}
String(int offset, int count, char value[]) {
    this.value = value;
    this.offset = offset;
    this.count = count;
}

可知此时的内存结构会变成这样

image.png

对象A的内存空间被回收了，对象B指向这个字符数组，但对象B只使用了其中的c d两个字符，其余的空间没用但又无法回收，也就造成了内存泄露。因此在JDK7中对String类做了优化

2. JDK7/8中的String类

JDK7中对String类做了优化，一直延续到JDK8，先看源码

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    /** The value is used for character storage. */
    private final char value[];
    ...
}

可以看到offset和count没有了，也就没有了内存泄露的问题。当然JDK6和JDK7中的String实现方式，在理论上来说，是各有利弊的。加上offset和count(JDK6)可以在substring时共用同一个数组，节省内存，但是会造成内存泄露；而不加offset和count(JDK7/8)在substring时无法共享数组，多占了空间，但同时也避免了内存泄露。

3. JDK9中的String类

Java默认使用的是Unicode编码，所以在String中使用的是char数组，其中每个字符占两个字节，如果开发人员使用的是纯英文，使用ASCII编码即可，那么每个字符用一个字节即可，这种情况下使用char数组会浪费50%的内存空间，因此在JDK9中又进行了优化，先看源码

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {

    private final byte[] value;

    /**
     * The identifier of the encoding used to encode the bytes in
     * {@code value}. The supported values in this implementation are
     *
     * LATIN1
     * UTF16
     *
     * @implNote This field is trusted by the VM, and is a subject to
     * constant folding if String instance is constant. Overwriting this
     * field after construction will cause problems.
     */
    private final byte coder;

可以看到value的类型变成了byte[]，如果字符串是纯拉丁文的话，coder值为0，此时字节数组中一个字节代表字符串中的一个字符，如果不是纯拉丁文的话，coder值为1，此时字节数组中两个字节代表字符串中第一个字符。

二、字符串分别会在哪些位置创建对象

String A = "abc"、String A = new String("abc")、String A = new String("abc").intern()是比较常见的创建对象的方式，那么在Java代码编译运行时，这些语句分别会对应什么操作呢？
这里先设置两个前提，以方便后续的讨论：

字符串实现以JDK7/8为准
不同版本的字符串常量池可能会处于不同的Java内存区，为了讨论方便，以下会使用堆、栈和字符串常量池等运行时内存区中的概念，但不会讨论运行时常量池处理方法区还是堆区

1. String A = "abc"

通过以下jclasslib查看字节码文件，发现"abc"在编译时会被编译到字节码文件的常量池中

image.png

在代码运行时，class文件会被加载进内存，那么"abc"这个String对象会在字符串常量池中创建，如图所示

image.png

在执行String A = "abc"时，会将字符串常量池中的对象地址返回给变量A，于是内存结构如图所示

image.png

2. String A = new String("abc")

在这种情况下，编译和类加载步骤和上一种情况一样，但是执行步骤会有不同。在执行该语句时，会在堆中创建出对象。先看构造函数源码

public String(String original) {
        this.value = original.value;
        this.hash = original.hash;
}

所以，执行new String("abc")时会在堆中再创建一个对象，但是共用常量池中的字符数组，内存结构如下：

image.png

3. String A = new String("abc").intern()

对于这种情况，编译、类加载以及执行new String("abc")的步骤和第二种情况一样，为了便于理解，先将改语句分为两个步骤String B = new String("abc"); String A = B.intern();对于语句一执行后，内存结构如下：

image.png

对于语句二，B.intern()方法会去字符串常量池中找到和字符串B equals的String对象，并将找到的String对象的地址返回，所以语句二执行之后，内存结构如下：

image.png

现在，回到语句String A = new String("abc").intern()，该语句执行后的内存结构如下所示：

image.png

地址为0x3456的对象在接下来的内存回收中会被回收

三、总结

以上是参考网上各类博客，结合源码以及个人理解总结而成的，如果有误，欢迎指正。

最后编辑于：2020.12.25 19:24:55

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,907评论 6赞 506
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,987评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,298评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,586评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,633评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,488评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,275评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,176评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,619评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,819评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,932评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,655评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,265评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,871评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,994评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,095评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,884评论 2赞 354

JDK6/7/8/9中的String类

一、String类在JDK6，7/8，9中的实现

1. JDK6中的String类

2. JDK7/8中的String类

3. JDK9中的String类

二、字符串分别会在哪些位置创建对象

1. String A = "abc"

2. String A = new String("abc")

3. String A = new String("abc").intern()

三、总结

推荐阅读更多精彩内容