1)问什么是垃圾
一般来说没有被引用的对象就是垃圾,就是要被清除, 有个例外如果几个对象引用形成一个环,互相引用,但根访问不到它们,这几个对象也是垃圾,也要被清除。
2)如何检垃圾
垃圾回收策略:
- 标记清除
标记清除是最常用的垃圾回收方式。 当变量进入执行环境时,就标记这个变量为"进入环境"。 当变量离开环境时,则将其标记为"离开环境"。被标记为离开环境的变量,在下一次垃圾回收启动时,就会被释放掉占用的空间。
1、垃圾收集器在运行的时候会给存储在内存中的所有变量都加上标记(当然,可以使用任何标记方式)。
2、然后,它会去掉运行环境中的变量以及被环境中变量所引用的变量的标记
3、此后,依然有标记的变量就被视为准备删除的变量,原因是在运行环境中已经无法访问到这些变量了。
4、最后,垃圾收集器完成内存清除工作,销毁那些带标记的值并回收它们所占用的内存空间。
- 引用计数法
跟踪记录每个值被引用的次数。当声明了一个变量并将一个引用类型值赋给该变量时,则这个值的引用次数就是1。如果同一个值又被赋给另一个变量,则该值的引用次数加1。相反,如果包含对这个值引用的变量又取得了另外一个值,则这个值的引用次数减1。当这个值的引用次数变成0时,则说明没有办法再访问这个值了,因而就可以将其占用的内存空间回收回来。这样,当垃圾回收器下次再运行时,它就会释放那些引用次数为0的值所占用的内存。
缺点:无法解决循环引用:
要解决循环引用的问题,最好是在不使用它们的时候将它们手动设为空。
几种垃圾回收算法
一种算法是标记 标记-清除 算法,还想说出不同的算法可以参考这里。
1、 标记-清除算法 Mark-Sweep GC
分为两个阶段:
- 标记阶段:从根集合出发,将所有活动对象及其子对象打上标记
- 清除阶段:遍历堆,将非活动对象(未打上标记)的连接到空闲链表上
优点
- 实现简单, 容易和其他算法组合
缺点
- 碎片化, 会导致无数小分块散落在堆的各处
- 分配速度不理想,每次分配都需要遍历空闲列表找到足够大的分块
- 与写时复制技术不兼容,因为每次都会在活动对象上打上标记
2、标记整理(或标记压缩)
和“标记-清除”相似,不过在标记阶段后它将所有活动对象紧密的排在堆的一侧(压缩),消除了内存碎片, 不过压缩是需要花费计算成本的。如下图过程,标记后需要定位各个活动对象的新内存地址,然后再移动对象,总共搜索了3次堆。
优点
- 有效利用了堆,不会出现内存碎片 也不会像复制算法那样只能利用堆的一部分
缺点
- 压缩过程的开销,需要多次搜索堆
3、引用计数 Reference Counting
引用计数,就是记录每个对象被引用的次数,每次新建对象、赋值引用和删除引用的同时更新计数器,如果计数器值为0则直接回收内存。 很明显,引用计数最大的优势是暂停时间短
优点
- 可即刻回收垃圾
- 最大暂停时间短
- 没有必要沿指针查找, 不要和标记-清除算法一样沿着根集合开始查找
缺点
- 循环引用无法回收
4、 GC 复制算法
将堆分为两个大小相同的空间 From 和 To, 利用 From 空间进行分配,当 From 空间满的时候,GC将其中的活动对象复制到 To 空间,之后将两个空间互换即完成GC。
优点
- 优秀的吞吐量, 只需要关心活动对象
- 可实现高速分配; 因为分块是连续的,不需要使用空闲链表
- 不会发生碎片化
- 与缓存兼容
缺点
- 堆使用率低
- 递归调用函数, 复制子对象需要递归调用复制函数 消耗栈
5、分代回收
详见链接:https://blog.csdn.net/qq_41257129/article/details/104199725
出发点:大部分对象生成后马上就变成垃圾,很少有对象能活的很久
新生代 = 生成空间 + 2 * 幸存区 (使用复制算法)
老年代 (使用-清除算法)
- 新生代中的对象:为存活时间较短的对象
- 老生代中的对象:为存活较长或常驻内存的对象
对象在生成空间创建,当生成空间满之后进行 minor gc,将活动对象复制到第一个幸存区,并增加其“年龄” age,当这个幸存区满之后再将此次生成空间和这个幸存区的活动对象复制到另一个幸存区,如此反复,当活动对象的 age 达到一定次数后将其移动到老年代; 当老年代满的时候就用标记-清除或标记-压缩算法进行major gc