字符串广泛应用 在 Java 编程中,在 Java 中字符串属于对象,Java 提供了 String 类来创建和操作字符串。
创建字符串
- 三种构造方法
- public String():创建一个空白字符串,不含有任何内容
- public String(char[] array):根据字符数组的内容,来创建对应的字符串。
- public String(byte[] array):根据字节数组的内容,来创建对应的字符串。
- 一种直接创建(字面量)
- String str = "Hello";//右边直接用双引号
//使用空参构造
String str1 = new String();//小括号留空,说明字符串说明内容都没有
System.out.println("第1个字符串" +str1);
//根据字符数组创建字符串
char[] charArray = {'A','B','C'};
String str2 = new String(charArray);
System.out.println("第2个字符串" +str2)
;
//根据字节数组的内容,来创建对应的字符串
byte[] byteArray = {97,98,99};
String str3 = new String(byteArray);
System.out.println("第3个字符串" +str3);
使用直接创建的方式(字面量)创建的字符串放在常量池中,使用new String() 创建的字符串放在堆内存中
String 类是不可改变的
String s = "Hello";
System.out.println("s = " + s);
s = "World";
System.out.println("s = " + s);
// 输出结果为:
Hello
World
实例中的 s 只是一个 String 对象的引用,并不是对象本身,当执行 s = "Hello"; 创建了一个新的对象 "World",而原来的 "Hello" 还存在于内存中。
-
String为什么不可变?
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];
查看string的源码,即可知道字符串实际上就是一个 char 数组,并且内部就是封装了一个 char 数组。并且这里 char 数组是被 final 修饰的。String 中的所有的方法,都是对于 char 数组的改变,只要是对它的改变,方法内部都是返回一个新的 String 实例。
-
那放在内存中的hello,什么时候进行释放呢?
这里需要引入一个新的概念,String 常量池
1.常量池(Constant Pool)
1.1 常量池(Class文件常量池):.java经过编译后生成的.class文件,是Class文件的资源仓库。
1.2 常量池中主要存放俩大常量:字面量(文本字符串,final常量)和符号引用(类和接口的全局定名,字段的名称和描述,方法的名称和描述),如下图:
- 运行时常量池(Constant Pool)
运行时常量池是方法区的一部分。在Class常量池中,用于存放编译期间生成的字面量和符号量,在类加载完之后,存入运行时常量池中。而运行时常量池期间也有可能加入新的常量(如:String.intern方法)
- String常量池,
String常量池,JVM为了减少字符串对象的重复创建,在堆区开一段内存存放字符串。
根据JVM相关知识,可以知道JVM 的GC操作主要发生在堆区,但是具体什么时候释放,需要根据JVM具体来分析,详见后续JVM文章
String的长度
String是使用的一个char类型的数组来存储字符串中的字符的,Java中定义数组是可以给数组指定长度的,当然不指定的话默认会根据数组元素来指定。
/**
* Returns the length of this string.
* The length is equal to the number of <a href="Character.html#unicode">Unicode
* code units</a> in the string.
*
* @return the length of the sequence of characters represented by this
* object.
*/
public int length() {
return value.length >> coder();
}
通过源码来看看int类型对应的包装类Integer可以看到,其长度最大限制为2^31 -1,那么说明了数组的长度是0~231-1,那么计算一下就是(231-1 = 2147483647 = 4GB)
但是实际我们创建超过65535个字符,就会编译报错。
这个又涉及到JVM编译规范,如果我们将字符串定义成了字面量的形式,编译时JVM是会将其存放在常量池中,这时候JVM对这个常量池存储String类型做出了限制,接下来我们先看下手册是如何说的。
在class文件中u2表示的是无符号数占2个字节单位,我们知道1个字节占8位,2个字节就是16位 ,那么2个字节能表示的范围就是2^16- 1 = 65535。
所以首先字符串的内容是由一个字符数组 char[] 来存储的,由于数组的长度及索引是整数,且String类中返回字符串长度的方法length() 的返回值也是int ,所以通过查看java源码中的类Integer我们可以看到Integer的最大范围是2^31 -1,由于数组是从0开始的,所以数组的最大长度可以使【0~2^31】通过计算是大概4GB。
但是通过翻阅java虚拟机手册对class文件格式的定义以及常量池中对String类型的结构体定义我们可以知道对于索引定义了u2,就是无符号占2个字节,2个字节可以表示的最大范围是2^16 -1 = 65535。其实是65535,但是由于JVM需要1个字节表示结束指令,所以这个范围就为65534了。超出这个范围在编译时期是会报错的,但是运行时拼接或者赋值的话范围是在整形的最大范围。
来自:CSDN(作者:wellleo)
String拼接
-
String:字符串常量,字符串长度不可变。Java中String 是immutable(不可变)的。用于存放字符的数组被声明为final的,因此只能赋值一次,不可再更改。
- concat()通过复制数组在通过 char 数组进行拼接生成一个新的对象,所以地址值会有变动
- ”+“ 号,编译时不会进行地址值的改变(jvm优化),**运行时拼接会改变地址,底层使用stringbuilder实现
StringBuffer:字符串变量(Synchronized,即线程安全)。如果要频繁对字符串内容进行修改,出于效率考虑最好使用 StringBuffer,如果想转成 String 类型,可以调用 StringBuffer 的 toString() 方法。Java.lang.StringBuffer 线程安全的可变字符序列。在任意时间点上它都包含某种特定的字符序列,但通过某些方法调用可以改变该序列的长度和内容。可将字符串缓冲区安全地用于多个线程。
StringBuilder:字符串变量(非线程安全)。在内部 StringBuilder 对象被当作是一个包含字符序列的变长数组。
基本原则:
- 如果要操作少量的数据用 String ;
- 单线程操作大量数据用StringBuilder ;
- 多线程操作大量数据,用StringBuffer。
常见面试题
- 写一个方法来判断一个String是否是回文(顺读和倒读都一样的词)?
// 回文就是正反都一样的词,如果需要判断是否是回文,只需要比较正反是否相等即可。String类并没有提供反转方法供我们使用,但StringBuffer和StringBuilder有reverse方法。
private static boolean isReversesame(String str) {
if (str == null)
return false;
StringBuilder strBuilder = new StringBuilder(str);
strBuilder.reverse();
return strBuilder.toString().equals(str);
}
// 假设面试官让你不使用任何其他类来实现的话,我们只需要首尾一一对比就知道是不是回文了。
private static boolean isReversesame(String str) {
if (str == null)
return false;
int length = str.length();
System.out.println(length / 2);
for (int i = 0; i < length / 2; i++) {
if (str.charAt(i) != str.charAt(length - i - 1))
return false;
}
return true;
}
- String是不可变的有什么好处?
- 由于String是不可变类,所以在多线程中使用是安全的,我们不需要做任何其他同步操作。
- String是不可变的,它的值也不能被改变,所以用来存储数据密码很安全。
- 因为java字符串是不可变的,可以在java运行时节省大量java堆空间。因为不同的字符串变量可以引用池中的相同的字符串。如果字符串是可变得话,任何一个变量的值改变,就会反射到其他变量,那字符串池也就没有任何意义了。
- 允许对象HashCode,hash之后值不会变化,所以hashmap大多数使用String作为键值