JAVA中常遇到的几种常量池的区别
1. Class文件常量池
Class文件中除了有类的版本信息,字段,方法,接口等描述信息外,还有一部分叫Class文件常量池,这个常量池可以理解为Class文件中的资源仓库,它当中主要存放两大类常量:字面量和符号引用
字面量:如文本字符串,"aaa"; 声明为final类型的常量值等等
符号引用:又分为三类常量
1)类和接口的全限定名
2)字段的名称和描述符
3)方法的名称和描述符
2. 运行时常量池
运行时常量池是方法区的一部分,Class文件常量池中的内容在编译时就产生了,而在类加载后,这部分内容会存在运行时常量池中,另外,由符号引用转变成的直接引用也会存在运行时常量池中。
运行时常量池相对于Class文件常量池的一个重要特征是具备动态性,也就是常量并不一定在编译时产生,运行时也可能将新的常量放入常量池中。
3. 字符串池
这是一个比较难懂的概念,在工作中,String类是我们使用频率非常高的一种对象类型。JVM为了提升性能和减少内存开销,避免字符串的重复创建,其维护了一块特殊的内存空间,即字符串池(String Pool)。这部分内存之前是在方法区,jdk1.8之后已经移除了方法区,转而替代为Metaspace区,那么这个字符串池应该是被划到这个Metaspace中了吧(有疑问,还没弄明白)。
我们知道,在Java中有两种创建字符串对象的方式:
1)采用字面值的方式赋值
2)采用new关键字新建一个字符串对象。
这两种方式在性能和内存占用方面存在着差别
方式一:采用字面值的方式赋值,例如:
String a = "aaa";
String b = "aaa";
System.out.println(a == b)
我们来分析一下过程,JVM首先会去字符串池中查找是否存在"aaa"这个对象,如果不存在,则在字符串池中创建"aaa"这个对象,然后将池中"aaa"这个对象的引用地址返回给字符串常量a,这样a会指向池中"aaa"这个字符串对象;如果存在,则不创建任何对象,直接将池中"aaa"这个对象的地址返回,赋给字符串常量b。所以a==b返回值是true,因为二均指向了字符串池中的"aaa".
方式二:采用new关键字新建一个字符串对象,例如:
String a = new String("aaa");
String b = new String("aaa");
System.out.println(a == b);
采用new关键字,JVM会先从常量池中查看有无"aaa"字符串,有的话就拷贝一份到新new出来的堆内存中,返回的是堆内存的地址;如果没有的话,直接在堆中new出来一块空间存放"aaa"的值,同样返回的是堆内存的地址,那么问题来了
这个时候这个堆内存的"aaa"是否会也在字符串池中创建一份呢?
这个问题在网上争议很大,有的认为这个时候也会在字符串池中创建一份,这个说法我不太认同,因为这样的话岂不是造成了堆和字符串池的完全重复?也就是不管字符串池中有没有"aaa",只要我是new,那都会在堆和字符串池中同时存在"aaa".这样不就造成了内存的浪费吗?还有一种说法是,如果字符串池中没有"aaa",那先在堆中创造出"aaa",如果需要往字符串池中加入"aaa"的话,就调用String的intern方法。我个人比较认同这种说法。
关于intern方法
intern方法使用:一个初始为空的字符串池,它由类String独自维护。当调用 intern方法时,如果池已经包含一个等于此String对象的字符串(用equals(oject)方法确定),则返回池中的字符串。否则,将此String对象添加到池中,并返回此String对象的引用。 对于任意两个字符串s和t,当且仅当s.equals(t)为true时,s.instan() == t.instan才为true。所有字面值字符串和字符串赋值常量表达式都使用 intern方法进行操作。
下面看一些经常出现的例子
String s1 = "Hello";
String s2 = "Hello";
String s3 = "Hel" + "lo";
String s4 = "Hel" + new String("lo");
String s5 = new String("Hello");
String s6 = s5.intern();
String s7 = "H";
String s8 = "ello";
String s9 = s7 + s8;
System.out.println(s1 == s2); // true
System.out.println(s1 == s3); // true
System.out.println(s1 == s4); // false
System.out.println(s1 == s9); // false
System.out.println(s4 == s5); // false
System.out.println(s1 == s6); // true
首先说明一点,在java 中,直接使用==操作符,比较的是两个字符串的引用地址,并不是比较内容,比较内容请用String.equals()。
s1 == s2这个非常好理解,s1、s2在赋值时,均使用的字符串字面量,说白话点,就是直接把字符串写死,在编译期间,这种字面量会直接放入class文件的常量池中,从而实现复用,载入运行时常量池后,s1、s2指向的是同一个内存地址,所以相等。
s1 == s3这个地方有个坑,s3虽然是动态拼接出来的字符串,但是所有参与拼接的部分都是已知的字面量,在编译期间,这种拼接会被优化,编译器直接帮你拼好,因此String s3 = "Hel" + "lo";在class文件中被优化成String s3 = "Hello";,所以s1 == s3成立。
s1 == s4当然不相等,s4虽然也是拼接出来的,但new String("lo")这部分不是已知字面量,是一个不可预料的部分,编译器不会优化,必须等到运行时才可以确定结果,结合字符串不变定理,鬼知道s4被分配到哪去了,所以地址肯定不同。
s1 == s9也不相等,道理差不多,虽然s7、s8在赋值的时候使用的字符串字面量,但是拼接成s9的时候,s7、s8作为两个变量,都是不可预料的,编译器毕竟是编译器,不可能当解释器用,所以不做优化,等到运行时,s7、s8拼接成的新字符串,在堆中地址不确定,不可能与方法区常量池中的s1地址相同。
s4 == s5已经不用解释了,绝对不相等,二者都在堆中,但地址不同。
s1 == s6这两个相等完全归功于intern方法,s5在堆中,内容为Hello ,intern方法会尝试将Hello字符串添加到常量池中,并返回其在常量池中的地址,因为常量池中已经有了Hello字符串,所以intern方法直接返回地址;而s1在编译期就已经指向常量池了,因此s1和s6指向同一地址,相等。
这只是读书笔记,大多内容都是来自于其他前辈的帖子和《深入理解Java虚拟机》这本书,所有来源均列出,供大家阅读
Java字符串池和字符串堆的内存分配
String放入运行时常量池的时机与String.intern()方法解惑
Java 6,7,8 中的 String.intern – 字符串池
Java中的字符串常量池与Java中的堆和栈的区别
Java字符串池(String Pool)深度解析
触摸java常量池
Java中几种常量池的区分