在刷leetcode 451的时候,遇到这样一个问题,当一个字符串类型的变量频繁地进行字符连接操作(+=)的时候,内存溢出了,后面看了网上的代码发现用StringBuilder可以解决,于是到网上去学习了一下String、StringBuilder和StringBuffer三者的区别。
String
先说String。实际上String是一个字符串常量类型,可以看看我下面贴出来的源码截图:
可以看到很明显在value前面有一个final,这意味着这个值一旦赋值就不可改。
那常量意味着什么呢?举个例子:
String s = "a";
s = s+"a";
当编译第一行代码时,会在虚拟机的常量池中创建一个“a”的字符串对象,一旦有某个字符串变量需要用到“a”,虚拟机就会先从常量池找,如果找到“a”,就将a的引用返回;否则就在常量池中生成一个“a”。这么说可能不是很明白,看下一个例子:
String a="a";
String b="a";
String c=a+"";
String d="a"+"";
System.out.println(a==b);
System.out.println(a==c);
System.out.println(a==d);
结果是true,false,true。是不是很惊讶?我们知道在字符串比较的时候比较值必须用equalsTo()方法,用“==”比较的是地址,这说明a、b和d指向的是同一块内存,而c不是,这是为什么呢?
其实不难分析。再看下之前提到的“a”的建立过程,首先编译第一行的时候,常量池会生成一个对象“a”,然后变量a记住了“a”的地址,由于“a”已经存在与常量池中,那不难得知变量b取的和a是同一块地址,这个时候你可能会问那d呢?这个就是JAVA编译字符串的时候一个比较有意思的地方了,比如下面:
String s = "hello"+"world"+"!";
如果全是这种常量相加,那么就会直接将他生成一个“helloworld!”对象,那d经过编译显然也是d="a"了,所以不难解释a、b、d地址一样。
再来看c,刚才说了一旦字符串全是常量相加会直接编译成一个字符串,但是如果含有变量的话,就不一样了,由于字符串常量是final不可修改的,那么只能重新生成一个和原来一样的字符串进行操作。举例:
String s = "a";
s = s+"";
也就是说,第二行中s+"b"中的s是会重新生成一个“a”来与“”进行相加,这个重新生成的和原来在常量区的就不一样了,这就是为什么c的地址改变了。
StringBuilder和StringBuffer
说完复杂的,再来看看简单点的StringBuilder和StringBuffer,StringBuilder实际上是StringBuffer去掉线程安全的阉割版,少了线程安全部分所以更快,这里我们主要介绍StringBuilder。
StringBuilder和StringBuffer都是继承抽象类AbstractStringBuilder,来看看这个抽象类的部分代码:
是不是发现没有final了,这意味着什么?划重点啊同学们,这说明这个类是一个字符串变量类型,也就是说在进行字符串连接的时候,及时存在变量也不会重新生成新的串。来看下面的例子:
StringBuilder sb = new StringBuilder("a");
sb.append("b");
这个时候就是在原来的“a”上对“b”进行连接。
总结
写到这里大概就可以弄清为什么频繁的进行s=s+"a"连接String的效率极低,因为他每次都需要生成新的字符串对象。
效率比较:
StringBuilder>StringBuffer>String
StringBuilder比StringBuffer快是因为省去了线程安全的过程,因此我们可以根据不同的情形对这三个字符串类型进行使用:
- 操作少量的数据使用String
- 单线程操作字符串缓冲区下操作大量数据使用StringBuilder
- 多线程操作字符串缓冲区下操作大量数据StringBuffer