对象分配过程+对象创建过程+对象内存布局。
一.堆概述
1.一个JVM进程存在一个堆内存。
2.java堆区在JVM启动时被创建,其空间大小也被确定(堆内存大小可以调整)。
3.本质上堆是 一组在物理上不连续的内存空间,但是逻辑上是连续的空间。
4.所有线程共享堆,但是堆内对于线程处理还是做了一个线程私用的部分(TLAB)。
二.堆的内存细分(新生代+老年代)
为什么呢需要分代?有什么好处?
经研究表明,不同对象的生命周期不一致,但是在具体使用过程中70%-90%的对象时临时对象。
分代唯一的理由时优化GC性能。如果没有分代,所有对象在一块空间,GC想要回收扫描就必须扫描所有对象,分代之后,长期持有的对象可以挑出,短期只有的对象可以固定在一个位置进行回收,省掉很大一部分空间利用。
三.对象产生过程自述:
1.我是一个普通的java对象,我出生在Eden区,在Eden区我还看到和我长得很像得小兄弟,我们在Eden区中完了挺长时间。
2.有一天Eden区中的人实在是太多了,我就被迫去了Survivor区中得From区,自从去了Survivor区,我就开始了我漂泊的一生,有时候在Survivor区中的From区,有时候在Survivor区中的To区,居无定所。
3.直到我18岁的时候,爸爸说我成人了,该去社会上闯闯了,于是我就去了老年代那边,老年代里人很多,并且年龄都挺大的,我在这里也认识了很多人,在老年代啊里,我生活了20年(每次GC加一岁),然后被回收。
四.MinorGC,MajorGC,FullGC的区别。
JVM在进行GC时,并非每次都堆上面的三个内存区域一起回收,大部分的只会针对Eden区进行。
在JVM标准中,他里面的GC按照回收区域划分为两种:
一种是部分采集(PartialGC):
新生代采集(MinorGC/YoungCG):只采集新生代数据。
老年底采集(MajorGC/OldGC):只采集老年代数据,目前只有CMS会单独采集老年代。
混合采集(MixedGC):采集新生代与老年代部分数据,目前只有G1在使用。
一种是整堆采集(FullGC):
收集整个堆与方法区的所有垃圾。
五.GC触发策略。
年轻代触发机制:
1.当年轻代空间不足时,就会触发MinorGC,这里年轻代满指的是Eden区中满了。
2.因为java大部分对象都是举报朝生夕灭的特性,所以MinorGC非常频繁,一般回收速度也快。
3.MinorGC会触发STW行为,暂停其他用户的线程。
老年代触发机制:
1.出现MajorGC经常会伴随至少一次MinorGC(非绝对,老年代空间不足时会尝试触发MinorGC,如果空间还是不足,则会触发MajorGC.)
2.MajorGC比MinorGC速度慢10倍,如果MajorGC后内存还是不足则会出现OOM.
FullGC触发:
1.调用System.gc()时。
2.老年代空间不足时。
3.方法区空间不足时。
4.通过MinorGC进入老年代的平均大小大于老年代的可用内存时。
5.在Eden区使用Survivor进行复制时,对象大小大于Survivor的可用内存,则该对象转入老年代,且老年代可用内存小于对象内存。
注意:FullGC时开发或调优中尽量要避开的!!!
六.逃逸分析。
一个对象的作用域仅限于方法区域内部在使用的情况下,此种情况叫做非逃逸。
一个对象如果被外部其他类调用,或者是作用于属性中,此种情况叫做对象逃逸。
此种行为发生在字节码被编译后JIT对于代码的进一步优化。
使用逃逸分析,编译器可以对代码做如下优化:
1.栈上分配:JIT编译器在编译期间根据逃逸分析计算结果,如果发现当前对象没有发生逃逸现象,那么当前对象就有可能被优化成栈上分配,会将对象直接分配在栈中。
2.标量替换:有的对象可能不需要作为一个连续的内存结构存在也能被访问到,那么对象部分可以不存储在内存,而是存储在CPU寄存器中。
七.对象的几种实例化方案。
1.new(最常见方式)
2.Class.newInstance(反射)
3.Constructor.newInstance(xx)(反射)
4.obj.clone(克隆数据)
5.反序列化(从文件,网络中获取一个对象流)
八.对象创建步骤。
1.判断对象对应类是否加载,链接,初始化
虚拟机遇到一条new指令,首先会去检查这个指令参数能否在Metaspace的常量池中定位到一个类的符号引用。并且检查这个符号引用代表的类是否加载 ,解析和初始化(即判断类元信息是否存在,如果没有,那么在双亲委派模式下,使用当前类加载器以ClassLoader+包名+类名为key进行查找文件。如果没有文件抛出ClassNotFoundException异常,如果找到则加载并生成class类对象)
2.为对象分配内存
如果内存规整(使用指针碰撞分配)
如果内存不规整(虚拟机需要维护一个空闲列表)
3.处理并发安全问题。
采用CAS失败重试,区域加锁保证更新的原子性。
每个线程预先分配一块TLAB。
4.初始化分配到控件。
所有数据设置默认值,保证实例字段在不赋值的情况下,可以直接使用。
5.设置对象的对象头。
将对象的所属类,对象的HashCode和对象的GC信息,所信息等存储在对象的对象头中。
6.执行init方法进行初始化。
九.对象内存布局。
1.对象头(Header):
除开我们自己需要的应用数据,JVM需要对于对象进行相关管理时需要对于对象进行一些状态判定,信息检索等的一些额外数据。
a.运行时元数据(Mark Word):
hashCode值
GC分代年龄
锁状态标志
线程持有锁
偏向线程ID
偏向时间戳
b.类型指针(Klass):执行类云数据,用于确定该对象的所属类型。
c.length(如果是数组)
普通数据对象头64位数据,数组96位!!!
2.实例数据(Instance Data):
对象真正存储的数据,包含自有的类型字段及父类继承的
存储规则:
a.相同宽度字段分配在一起。
b.父类中定义的变量会在子类之前。
c.CompactFields参数为true,子类窄变量可能插入到父类变量空袭。
填充:此处不是必须,无含义,用作占位使用。