String对象深入理解

前言

String对象作为 Java 语言中重要的数据类型之一,是我们平时编码最常用的对象之一,因此也是内存中占据空间最大的一个对象。然而很多人对它是一知半解,今天我们就来好好聊一聊这个既熟悉又陌生的String。

一、String认识你,你认识它么?

假如面试的时候问你,什么是String(或者谈谈你对String的理解)?你会如何回答?“String是基础对象类型之一,是Java语言中重要的数据类型之一”。恐怕这是大多数人的回答,能力强些的可能会说,String底层是用char[ ]数组来实现的;如果面试官让你再继续呢?估计很多人会一脸尴尬,脑海里极力搜索关于String的相关知识,最后也只能恨自己平时对String关注的太少。下面就让我们一步一步地去认识String。

首先,来看一个面试经常遇到,错误率又很高的问题:

1 String str1 = “java”;

2 String str2 = new String(“java”);

3 String str3= str2.intern();

4 System.out.println(str1 == str2);

5 System.out.println(str2 == str3);

6 System.out.println(str1 == str3);

答案先不揭晓,各位先想一下,咱们继续往下看:

二、String对象的实现

我们把String对象的实现分为三个阶段来分析:java7之前的版本、java7/8版本、java8之后的版本。

1、 java7之前的版本中,String对象中主要由四个成员变量:char[]、偏移量offset、字符数量count、哈希值hash。String对象通过offset和count来定位char[],这么做可以高效、快速地共享数组对象,节省内存空间,但这种方式很有可能会导致内存泄漏。

2、java7/8版本中,String 去除了offset 和 count 两个变量。这样的好处是String 对象占用的内存稍微少了些,同时,String.substring()方法也不再共享char[],从而解决了使用该方法可能导致的内存泄漏问题。

3、java8之后的版本中,char[] 属性改为了 byte[] 属性,增加了一个新的属性coder,它是一个编码格式的标识。为什么这么做呢?我们知道一个char字符占16位,2 个字节。这种情况下,存储单字节编码内的字符(占一个字节的字符)就显得非常浪费。JDK1.9 的String类为了节约内存空间,于是使用了占8位,1个字节的 byte 数组来存放字符串。而新属性coder的作用是,在计算字符串长度或者使用 indexOf()函数时,我们需要根据这个字段,判断如何计算字符串长度。coder属性默认有0和1两个值,0代表Latin-1(单字节编码),1代表UTF-16。如果 String判断字符串只包含了Latin-1,则coder属性值为0,反之则为1。

三、String是不可变对象

1、为什么String是不可变对象

很多人背面试题的时候想必都对此很熟悉,那为什么String对象是不可变的呢?你有想过这其中的原因么?通过源码我们知道,String类被final关键字修饰了,而且变量char[]也被final修饰了。Java语法告诉我们:被final修饰的类不可被继承,被final修饰的变量不可被改变,一旦赋值了初始值,该final变量的值就不能被重新赋值,即不可更改,而char[]被 final+private修饰,说明String对象不可被更改。即String对象一旦创建成功,就不能再对它进行改变。

2、为什么String被设计成不可变对象

首先,是为了保证String对象的安全性,避免被恶意串改。比如将值为“abc”的引用赋值给str对象,即String

str = “abc”,如果此时有人恶意将“abc”改为“abcd”或其他值就会造成意想不到的错误。

其次,确保属性值hash不频繁变动,保证其唯一性。

最后,为实现字符串常量池提供方便。

举一个反例来证明String对象的不可变性

针对String对象不可变性,有人可能会说:对于一个String str =“hello”,然后改为String str =“world”,这个时候str的值变成了“world”,str值确实改变了,为什么还说String对象不可变呢?

首先,我们来解释一下对象和引用。对象在内存中是一块内存地址,str则是一个指向该内存地址的引用,所以在这个例子中,第一次赋值的时候,创建了一个“hello”对象,str引用指向“hello”地址;第二次赋值的时候,又重新创建了一个对象“world”,str引用指向了“world”,但“hello”对象依然存在于内存中。也就是说str并不是对象,而只是一个对象引用。真正的对象依然还在内存中,没有被改变。所以在Java中要比较两个对象是否相等,通常是用“==”,而要判断两个对象的值是否相等,则需要用equals方法来判断。

四、String常量池

在java中,创建字符串通常有两种方式:一种是通过字符串常量池的形式,比如String str

= “abcd”;另一种是直接通过new的形式,如String string = new String(“abcd”);

针对第一种方式创建字符串时,JVM首先会检查该对象是否存在于字符串常量池中,如果存在,就返回该引用,否则在常量池中创建新的字符串对象,然后将引用返回。这种方式可以减少同一个值的字符串对象的重复创建,节约内存。

采用new形式创建字符串时,首先在编译类文件时,"abcd"常量字符串将会放入到常量结构中,在类加载时,“abcd"将会在常量池中创建;其次,在调用new时,JVM命令将会调用String的构造函数,同时引用常量池中的"abcd”字符串,在堆内存中创建一个 String对象;最后,string将引用String对象。

五、String.intern()方法详解

先来看一个示例:

String a =newString("abc").intern();

String b = new String("abc").intern();

System.out.print(a==b);

你觉得输出的是false还是true?

答案是:true

在字符串常量中,默认会将对象放入常量池中;在字符串变量中,对象是会创建在堆内存中,同时也会在常量池中创建一个字符串对象,复制到堆内存对象中,并返回堆内存对象引用。如果调用intern()方法,会去查看字符串常量池中是否有等于该对象的字符串,如果没有,就在常量池中新增该对象,并返回该对象引用;如果有,就返回常量池中的字符串引用。堆内存中原有的对象由于没有引用指向它,将会通过垃圾回收器回收。

所以针对上面的例子中,在一开始创建a变量时,会在堆内存中创建一个对象,同时会在加载类时,在常量池中创建一个字符串对象,在调用intern()方法之后,会去常量池中查找是否有等于该字符串的对象,有就返回引用。在创建b字符串变量时,也会在堆中创建一个对象,此时常量池中有该字符串对象,就不再创建。调用 intern 方法则会去常量池中判断是否有等于该字符串的对象,发现有等于"abc"字符串的对象,就直接返回引用。而在堆内存中的对象,由于没有引用指向它,将会被垃圾回收。所以a和b引用的是同一个对象。

看完这些内容后,文章开头的问题,相比你也有了答案了。答案分别是:false、false、true。

六、String、StringBuffer和StringBuilder的区别

1.对象的可变与不可变

String是不可变对象,原因上面的内容已经解释过了,这里不再赘述。

StringBuilder与StringBuffer都继承自AbstractStringBuilder类,在AbstractStringBuilder中也是使用字符数组保存数据,这两种对象都是可变的。如下:

char[ ] value;

2.是否是线程安全

String中的对象是不可变的,也就可以理解为常量,所以是线程安全。

AbstractStringBuilder是StringBuilder与StringBuffer的公共父类,定义了一些字符串的基本操作,如expandCapacity、append、insert、indexOf等公共方法。

StringBuffer对方法加了同步锁或者对调用的方法加了同步锁,所以是线程安全的。看如下源码:

1  public synchronized StringBuffer reverse() {

2      super.reverse();

3      return this;

4  }

5

6  public int indexOf(String str) {

7      return indexOf(str, 0);        //存在 public synchronized int indexOf(String str, int fromIndex) 方法

8  }

StringBuilder并没有对方法进行加同步锁,所以是非线程安全的。

3.StringBuilder与StringBuffer共同点

StringBuilder与StringBuffer有公共的抽象父类AbstractStringBuilder。

抽象类与接口的一个区别是:抽象类中可以定义一些子类的公共方法,子类只需要增加新的功能,不需要重复写已经存在的方法;而接口中只是对方法的申明和常量的定义。

StringBuilder、StringBuffer的方法都会调用AbstractStringBuilder中的公共方法,如super.append(...)。只是StringBuffer会在方法上加synchronized关键字,进行同步。

如果程序不是多线程的,那么使用StringBuilder效率高于StringBuffer。


下面来几道测试题,看看自己对String究竟掌握了多少

七、测试题

test1:

如下代码中创建了几个对象

1 String str1 ="abc";

2 String str2 =new String("abc");

   对于1中的String str1 = "abc",首先会检查字符串常量池中是否含有字符串abc,如果有则直接指向,如果没有则在字符串常量池中添加abc字符串并指向它.所以这种方法最多创建一个对象,有可能不创建对象。

       对于2中的String str2 = new String("abc"),首先会在堆内存中申请一块内存存储字符串abc,str2指向其内存块对象。同时还会检查字符串常量池中是否含有abc字符串,若没有则添加abc到字符串常量池中。所以 new String()可能会创建两个对象。

       所以如果以上两行代码在同一个程序中,则1中创建了1个对象,2中创建了1个对象。如果将这两行代码的顺序调换一下,则String str2 = new String("abc")创建了两个对象,而 String str1 = "abc"没有创建对象。

test2:

看看下面的代码创建了多少个对象:

1     String temp="apple"; 

2     for(int i=0;i<1000;i++) { 

3           temp=temp+i; 

4     }


答案:1001个对象。


test3:

下面的代码创建了多少个对象:

1     String temp=newString("apple") 

2     for(int i=0;i<1000;i++) { 

3            temp=temp+i; 

4    }


答案:1002个对象。


test4:

1 String ok ="ok"; 

2 String ok1 =new String("ok"); 

3 System.out.println(ok== ok1);//fasle


ok指向字符串常量池,ok1指向new出来的堆内存块,new的字符串在编译期是无法确定的。所以输出false。


test5:

1 Stringok="apple1"; 

2 Stringok1="apple"+1; 

3System.out.println(ok==ok1);//true


编译期ok和ok1都是确定的,字符串都为apple1,所以ok和ok1都指向字符串常量池里的字符串apple1。指向同一个对象,所以为true。


test6:

1 Stringok="apple1"; 

2 inttemp=1; 

3 Stringok1="apple"+temp; 

4System.out.println(ok==ok1);//false


主要看ok和ok1能否在编译期确定,ok是确定的,放进并指向常量池,而ok1含有变量导致不确定,所以不是同一个对象.输出false。


test7:

1 Stringok="apple1"; 

2 final inttemp=1; 

3 Stringok1="apple"+temp; 

4 System.out.println(ok==ok1);//true

ok确定,加上final后使得ok1也在编译期能确定,所以输出true。


test8:

1 public staticvoid main(String[] args) {   

 2    String ok="apple1"; 

 3    final int temp=getTemp(); 

 4    String ok1="apple"+temp; 

 5    System.out.println(ok==ok1);//false      

 6 } 

 7  

 8 public static int getTemp(){ 

 9    return 1; 

10 }

ok一样是确定的。而ok1不能确定,需要运行代码获得temp,所以不是同一个对象,输出false。

以上内容如有错误还请各位批评指正!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容