这是《深入理解Java虚拟机》的读书笔记。
1、Java技术体系
- Java程序设计语言
- 各硬件平台上的Java虚拟机
- Class文件格式
- Java API类库
- 来自商业机构或者开源社区的第三方Java类库
2、Java运行时数据区
- 程序计数器:是一块较小的内存空间,是当前线程所执行的字节码的行号指示器。唯一一个没有OOM的内存区域。
- Java虚拟机栈:生命周期与线程相同。描述的是Java方法执行的内存模型:每个方法执行时都会创建一个栈帧,用于存储局部变量表、操作栈、动态链接、方法出口等信息。一个方法被调用执行的过程就是栈帧在虚拟机栈中从入栈到出栈的过程。
成员变量:
* 成员变量定义在类中,在整个类中都可以被访问。
* 成员变量随着对象的建立而建立,随着对象的消失而消失,存在于对象所在的堆内存中。
* 成员变量有默认初始化值。
局部变量:
* 局部变量只定义在局部范围内,如:函数内,语句内等,只在所属的区域有效。
* 局部变量存在于栈内存中,作用的范围结束,变量空间会自动释放。
* 局部变量没有默认初始化值
本地方法栈:和java虚拟机栈作用类似,只不过java虚拟机栈为虚拟机执行java方法服务,而本地方法栈为虚拟机使用到的Native方法服务。有些虚拟机把java虚拟机栈和本地方法栈合二为一了。
Java堆:几乎所有的对象实例都在这里分配内存。是垃圾收集器管理的主要区域,因此也叫“GC堆”,还好没叫垃圾堆。虽然是线程共享,也可能划分多个线程私有的分配缓冲区(TLAB)。从垃圾收集器算法角度可以把堆分成:新生代和老年代;在细点可以有Eden空间、From Survivor空间、To Survivor空间等。当前虚拟机堆都是可扩展的,可通过-Xmx最大值和-Xms最小值控制,设置成一样可避免堆自动扩展。
方法区:用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译的代码等数据。
程序计数器、虚拟机栈、本地方法栈三个区域随线程生而生,虽线程灭而灭。其中栈帧随着方法的进入和退出而有条不紊的执行着入栈和出栈操作。每个栈帧分配多少内存在类结构确定下来时就已知了,这几个区域内存分配和回收都具有稳定性,不需要过多考虑回收问题,线程灭就自动回收了。java堆和方法区的内存都是动态分配和回收的。方法区进行垃圾收集“性价比”比较低,主要还是管理Java堆。
对象访问
主流的访问方式有两种:句柄和直接指针。在各种语言和框架中这两种访问方式都很常见,各有千秋。
句柄访问
java堆中划出一块内存作为句柄池,句柄中包含对象实例数据和类型数据各自的具体地址信息。最大的好处就是reference中存储的是稳定的句柄地址,在对象被移动的时候只改变句柄的实例数据指针。(垃圾收集时移动对象是非常常见的现象)
直接指针
Java堆中的对象布局必须考虑如何防止类型数据地址。reference中存储的直接就是对象地址。最大的好处就是速度快,节省一次指针定位的时间开销。
再谈引用
引用:当reference类型的数据中存储的数值代表的是另一块内存的起始地址,就称其为引用。引用有如下4中类型:
强引用:只要强引用还存在,GC永远不会回收被引用的对象;
软引用(SoftReference):描述一些还有用,但不是必须的对象。对于只有软引用的对象,内存不足时,在OOM之前会被回收。
弱引用(WeakReference):描述的也是非必须的对象,但程度比软引用弱。只能存活到下次垃圾收集器工作之前,也就是说只要垃圾收集器工作,这种引用的对象都会被回收,不管当前内存是否足够。
虚引用(PhantomReference):又称幽灵引用或者幻影引用。它是最弱的一种引用关系。虚引用不会影响对象的生存时间,通过虚引用也无法获取对象实例。设置虚引用的唯一目的就是在对象对收集器回收时收到一个系统的通知。
3、垃圾收集器
确定对象是否已死
引用计数器:给对象添加一个引用计数器,每当有地方引用对象时,计数器就加1,当引用失效时,计数器就减1。当计数器等于0时,对象就不再可能被使用了。
优点:实现简单,判定效率高。
缺点:很难解决对象间循环引用的问题。根搜索算法:通过一系列名为“GC Roots”的对象作为起点向下搜索,搜索所走过的路径成为引用链。当一个对象到GC Roots没有任何引用链时,则证明这个对象不再可能被使用了。
在Java中可作为GC Roots的对象有:
* 虚拟机栈中引用的对象(栈帧中本地变量表)
* 方法区中的类静态属性引用的对象
* 方法区中的常量引用的对象
* 本地方法栈帧中JNI引用的对象
收集器判断对象不可达后,会检查对象的finalize()方法是否被执行过,如果没有就先执行finalize()。一个对象的finalize()只会被执行一次,如果一个对象在finalize()方法中被救活了,即重新被引用了,当它再次不可达时不会执行finalize()方法了。
垃圾收集算法
- 标记-清除算法(Mark-Sweep):顾名思义收集分为“标记”和“清除”两个阶段。标记就是上面介绍的标记对象死亡的过程。
优点:这是最基础的收集算法,其他的算法都是它的基础上演变来的。
缺点:1、效率问题,标记和清除效率都不高;2、空间问题,标记清除后产生大量的不连续的内存碎片。
- 复制算法(Copying):将内存分成大小相等的A、B两块,每次只使用其中一块,比如A,当A使用完了,就把还存活的对象拷到B上,然后把A空间一次清掉。
优点:实现简单、运行效率高。
缺点:可使用的内存缩小为原来的一半
改进:IBM研究表面,新生代中98%的对象都是朝生夕死,所以并不需要1:1来划分。所以分成一块较大的Eden空间和a、b两块较小的Survivor空间(Eden:Survivor = 8:1)。每次使用Eden和一块Survivor空间,比如Survivor-a,用完了就把存活的对象拷到Survivor-b上,然后清除Eden和Survivor-a,然后再使用Eden和Survivor-b。每次浪费10%的空间,如果存活对象大于10%就把多出来的对象放到给新生代担保的老年代。
目前商业虚拟机都采用改进后的复制算法回收新生代。
标记-整理算法(Mark-Compact):标记还是对象标记的那个标记。整理是把存活的对象移动到内存的一端,然后清理掉端边界以外的内存。
分代收集算法(Generational Collection):这个算法没有新思想。只是根据对象存活周期将内存划分成新生代和老年代两块。然后不同的年代采用不同收集算法,新生代用复制算法,老年代因为没有额外空间给它内存担保,而且对象存活时间长,那就用标记-整理或者标记-清除。
4、类加载
Class文件需要被加载到虚拟机中才能被运行和使用。生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)七个阶段。
类加载器
虚拟机中类的唯一性由类本身和它的加载器决定。
双亲委派模型的父子关系不是继承,而是组合关系。
双亲委派模型的工作工程:类加载器收到类加载请求时,首先不会尝试自己加载这个类,而是把这个请求委派给父类加载器去完成,每一层加载器都是如此,所以所有的加载请求都会传递到启动类加载器,只有父加载器反馈自己无法完成这个加载请求时(它的搜索范围中没有找到所需的类),子加载器才会尝试自己去加载。