1.String的特殊性
1.1对象的初始化
public class Test {
public static void main(String[] args) {
String str1 = new String("abcd");
String str2 = "abcd";
}
}
1.1.1记住几点:
1.栈区(线程私有)存引用(对象的标识==》值)和基本类型(值),不能存对象而堆区存对象。
2.==是比较地址,String 类重写了 equals()方法,比较对象内容(比较的是底层的char[] 内每一个字符是否相等)。
3.Java的每一个类都有一个常量池,这个常量池定义在.class文件中有描述(javap -v 类的全类名 可以看到内容),包括值、标识符(举个例子,String a ="astr";int b = 1;这些代码中的 标识符a,b和值 “astr”,1 都是常量池的内容)、属性名、类名、方法名等。在jvm装载.class文件时,会装载这些常量到类的常量池中。
每个JVM实例同时会在方法区维持一个String pool,在装载每个类常量池的字符串型常量时,会先将这些字符串常量的引用存储到String pool中,然后将这些引用给每个类的常量池。
记住:string pool中存的是引用值而不是具体的实例对象,具体的实例对象是在堆中开辟的一块空间存放的。
1.1.2下面解释对象创建过程:
1.1.2.1 String str = "abcd":
实现过程:
首先栈区创建str1引用,然后在String池中寻找其指向的内容为"abcd"的对象,如果String池中没有,则创建一个,然后str1指向String池中的对象,如果有,则直接将str1指向"abcd";
推论及验证:
如果后来又定义了字符串变量 str2 = "abcd",则直接将str2引用指向String池中已经存在的“abcd”,不再重新创建对象;这时str1==str2。
但是需要注意的一点是:
Java 语言提供对字符串串联符号("+")以及将其他对象转换为字符串的特殊支持,字符串串联是通过 StringBuilder(或 StringBuffer)类及其 append 方法实现的.字符串转换是通过 toString 方法实现的,该方法由 Object 类定义,并可被 Java 中的所有类继承。
注意点的验证:
如果内容为"abc"的str1进行了字符串的"+"连接str1 = str1+"d";此时str1指向的是在堆中新建的内容为"abcd"的对象,即此时进行str1==str2,返回值false,因为地址不一样。
1.1.2.2 String str = new String("abcd"):
实现过程:
直接在堆中创建对象。如果后来又有String str3 = new String("abcd"),str3不会指向String pool里面的对象,而是在堆中重新创建一个对象并指向它。
验证方式:
如果此时进行str2==str3以及str1 == str3 均会返回false,因为两个对象的地址不一样,如果是str2.equals(str3),返回true,因为内容相同。
注意的一点:
str.intern()这个方法就是将str指向的String对象内容,存储一份到String pool里并返回在String pool里“引用”;
1.2String对象的不可性(immutable)
1.2.1我们无法利用String提供的API来改变对象的内容
public class Test {
public static void main(String[] args){
String str1 = new String("abcd");
String str2 = str1;
String str3 = str1+"e";//增加字符
System.out.println(str1);
System.out.println(str2 ==str1);
String str4 = str1.replace("a", "z");//替换字符
System.out.println(str1);
System.out.println(str2 ==str1);
String str5 = str1.substring(2);//截取字符
System.out.println(str1);
System.out.println(str2 ==str1);
String str6 = str1.toLowerCase();//转小写
System.out.println(str1);
System.out.println(str2 ==str1);
String str7 = str1.toUpperCase();//转大写
System.out.println(str1);
System.out.println(str2 ==str1);
String str8 = str1.trim();//去除两端空格字符
System.out.println(str1);
System.out.println(str2 ==str1);
}
}
如以上等等的方法均未改变str1的值及其指向String对象的值。因为所有的API 相关的操作都是对底层的char[] value进行deepcopy后进行的操作
1.2.2但是反射可以做到
public class Test {
public static void main(String[] args) throws NoSuchFieldException, SecurityException, IllegalArgumentException, IllegalAccessException {
String str1 = new String("abcd");
//here is an way to change str1
Class clazz = str1.getClass();
Field valueField = clazz.getDeclaredField("value");
valueField.setAccessible(true);
char [] str1Changed = new char[]{'z','x','c','v'};
valueField.set(str1, str1Changed);
System.out.println(str1);
}
}
这是利用反射修改str1指向对象的内容
1.2.3不可变对象的优势
1.2.3.1 天生的线程安全性(只能读取不能修改)
1.2.3.2 在性能上的提升(可缓存,不必每次都要申请内存初始化等从而提升性能)
2.关于字符及编码及乱码
String:"字符"串,这个字符就是我们人通常理解的抽象的符号(例如"a","b","中"等),但是在计算机是无法存储这种抽象的符号(只能存储数值),只能依靠数值与符号的映射关系(编码字符集)来解决数值和符号的对应关系然后显示字符。计算机上很常见的显示乱码一般有下面几个原因:一个字节序列本身有问题(文件破坏掉了,这个情况较少,而且基本无解),第二个就是我们解码的方式不对(这种常见,本身是UTF-8格式编码的,我们却以GBK的形式解码,修改解码方式),第三个就是我们缺少对应的显示方法(这种也常见,文件是UTF-8的我们以UTF-8解码,但是其中某些字码对应国外的文字符号,我们缺少显示方法,解决方法为安装缺少对应字符集),参考如下代码
public class Test {
public static void main(String[] args) throws UnsupportedEncodingException {
String str = "wo是中国人";//默认编码格式UTF-16
byte [] gbkbytes = str.getBytes("GBK");//进行GBK编码
byte [] utf8bytes = str.getBytes("UTF-8");//进行UTF-8编码
System.out.println(gbkbytes.length);
assert gbkbytes.length == 10;
System.out.println(utf8bytes.length);
assert utf8bytes.length == 14;
//对gbkbytes 进行 UTF8解码
System.out.println(new String(gbkbytes, "UTF-8"));//wo�����
//对utf8bytes 进行GBK解码
System.out.println(new String(gbkbytes, "GBK"));//wo鏄鍥戒汉
}
}