本人两年工作经验,但是在面试过程中被多次问到:java的垃圾回收机制,但是后面回想起来似乎回答的都比较模棱两可,所以在学习的过程中特意记录如下:
1. JVM 内存运行时数据的三个重要地方
· 堆(heap): 他是最大的一个区域,用于存放对象实例和数组,是全局共享的
· 栈(stack):全称为虚拟机栈,主要存储基本数据类型,以及对象的引用,私有线程
·方法区(Method Area):在class 被加载后的一些信息 如常量,静态常量这些被放在这里,在Hotspot里面我们被它 称之为永生代。
堆:在JVM中占用的内存最多,也叫逻辑堆,主要用来存放对象实例和数据,对于所有的线程都是共享的,对于Heap 堆区的内存是动态分配的,所以空间大小和生命周期都是不明确的,而GC的主要作用就是自动释放逻辑堆的实例对象所占的内存空间,而在堆的内存空间里面又分为新生代和老年代,用来区分对象的存活时间,在新生代中还被细分为Eden SurvivorFrom survivorTo 这三部分。
方法区(Method Area):主要存储的是类加载器ClassLoad 加载的类信息,存储包括:类的元数据,常量池,字段,静态变量与方法内部的局部变量,以及编译好的字节码。
栈:在每一个对的创建,在栈区都有一个对他的引用,记录了对象实例的地址值,对象实例信息存储在堆区。
pc 寄存器:在多线程中,系统需要给每一个线程分配一个线程编号,会用到寄存器。
如图:逻辑堆分为年轻代与年老代,而年轻代又分为 Eden Survivor1 Surivoo2 ,对于一个新实例化的对象都是存储在Eden区,按照GC的原理,会回收掉当前对象没有被引用的对象,而一般对象都是在年轻代就会死去,所以年轻代需要频繁的GC清理。
年轻代:
在年轻代中jvm使用的Mark-copy 算法,顾名思义是有两个阶段,第一个阶段Mark(标记),第二阶段 Copy(复制),Mark主要是标记被引用的对象,清理掉没有被引用的实例,释放内存,然后copy 就是将还被引用的对象复制到不同的年龄代。
对于标记与区分年龄代的技术,我们一般都是采用计数器,在每一个对象都含有引用计数器,都是引用指向对象的时候引用计数器+1,不在被引用的技术器减1,对与垃圾回收策略则是标记活的实例,没有被标记的实例全部回收,释放内存。
对于静态方法和静态变量,我们知道静态方法和变量不产生实例,直接通过类的引用,使用classLoad 进行加载的类数据是不存在逻辑堆里面的,而是直接存在与永生待里,也就是方法区里,这个类一旦被清除,这个类里面的所有静态方法和静态变量就全部被清除了。
老年代:
当GC触发的时候,Eden区的对象会被转移到Survior1 区,然后再次GC就会被转换到Survivor2 区,当Survivor11区的对象太大Survivor2 无法容纳的时候,就会直接转到永生代,也就是老年代。
年老代的算法:
Serial GC
Parallel GC
Parallel Old GC(Parallel Compacting GC)
Concurrent Mark & Sweep GC (or “CMS”)
Garbage First (G1) GC
关键的两种:
1. PS(Parallel Scavenge) : PS执行的是Mark-compact 算法的过程,并且是用多线程进程执行提高了效率,Mark与年轻代的算法一致,但是Compact 算法则是将老年代的对象进行碎片整理,之后空出多余的内存空间。
2. CMS(Concurrent Mark sweeps):我们简称他为 CMS 算法,对与cms算法,我们先需要了解一个概念 Stop the world,对于Stop the world,不管选择哪种GC算法,stop-the-world都是不可避免的。Stop-the-world意味着从应用中停下来并进入到GC执行过程中去。一旦Stop-the-world发生,除了GC所需的线程外,其他线程都将停止工作,中断了的线程直到GC任务结束才继续它们的任务。GC调优通常就是为了改善stop-the-world的时间。在CMS GC开始时的初始标记(initial mark)比较简单,只有靠近类加载器的存活对象会被标记,因此停顿时间(stop-the-world)比较短暂。在并发标记(concurrent mark)阶段,由刚被确认和标记过的存活对象所关联的对象将被会跟踪和检测存活状态。此步骤的不同之处在于有多个线程并行处理此过程。在重标记(remark)阶段,由并发标记所关联的新增或中止的对象瘵被会检测。在最后的并发清理(concurrent sweep)阶段,垃圾回收过程被真正执行。在垃圾回收执行过程中,其他线程依然在执行。得益于CMS GC的执行方式,在GC期间系统中断时间非常短暂。CMS GC也被称为低延迟GC