转载
https://www.zhihu.com/question/53613423/answer/135743258
记录R大的几个观点:
1. GC Roots
2. Tracing GC的思想
3. 分代的好处
4. Major GC和Full GC的区别
2. Tracing GC的思想
Tracing GC的根本思路就是: 给定一个集合的引用作为根出发, 通过引用关系遍历对象图, 能被遍历到的(可到达的)对象就被判定为存活, 其余对象(也就是没有被遍历到的)就自然被判定为死亡, 注意再注意: tracing GC的本质是通过找出所有活对象来把其余空间认定为"无用", 而不是找出所有死掉的对象并回收它们占用的空间.
从root set出发遍历看能顺着引用遍历到哪些young gen里的对象, 这些对象就被认定为是活的, 而young gen里剩余的空间, 无论是没有对象还是有死对象, gc都不关系, 总之一股脑可以回收来用.
分代式GC对GC roots的定义的影响:
分代式GC是一种部分收集(partial collection)的做法. 在执行部分收集时, 从GC堆得非收集部分指向收集部分的引用, 也必须作为GC roots的一部分.
具体到分两代的分代式GC来说, 如果第0代叫做young gen,第1代叫做old gen, 那么如果有minor GC/young GC只收集young gen里的垃圾, 则young gen属于"收集部分", 而old gen属于"非收集部分", 那么从old gen指向young gen的引用就必须作为minor GC/young GC的GC roots的一部分.
继续具体到HotSpot VM里的分两代GC来说, 除了old gen到young gen的引用之外, 有些带有弱引用语义的结构, 例如说记录所有当前被加载的类的SystemDictionary、记录字符串常量引用的String Table等, 在young GC时必须要作为strong GC Roots, 而在收集整堆得full GC时则不会被看作strong GC roots.
划重点:
结合上面的概念, 可以理解为young GC比full GC的GC Roots要更大一些.
3. 分代的好处
对传统的、基本的GC实现来说, 由于它们在GC的整个工作过程中都要"stop-the-world", 如果能想办法缩短GC一次工作时间长度就是件重要的事情
, 如果说收集整个GC堆耗时太长, 那不如只收集其中的一部分.
这个思路所基于的基本假设: weak generational hypothesis
---大部分对象的生命期很短(die young), 而没有die young的对象则很可能会存活很长时间(live long)
这是对过往的很多应用行为分析之后得出的一个假设. 基于这个假设, 如果让新创建的对象都在young gen里创建, 然后频繁收集young gen, 则大部分垃圾都能在young gc中被收集掉. 由于young gen的大小配置通常只占整个GC堆得较小部分, 而且较高的对象死亡率(或者说较低的对象存活率)让它非常适合copying算法来收集, 这样就不但能降低单词GC的时间长度, 还可以提高GC的工作效率.
4. Major GC和Full GC的区别
4.1 针对HotSpot VM的实现, 它里面的GC其实准备分类只有两大种:
- Partial GC: 并不收集整个GC堆的模式
Young GC: 只收集young gen的GC
Old GC: 只收集old gen的GC, 只有CMS的concurrent collection是这个模式
Mixed GC: 收集整个young gen以及部分old gen的GC, 只有G1有这个模式 - Full GC: 收集整个堆, 包括young gen、old gen、perm gen(如果存在的话)等所有部分的模式
Major GC通常是跟full GC是等价的, 收集整个GC堆. 当有人说"major GC"的时候一定要问清楚他想要指的是上面的Full GC还是old GC.