1- 对象的创建
一个new的奇妙旅途(普通Java对象,不包括数组和Class对象)
A a = new B();
可以拆分成两句
A a; a = new B();
第一句声明的是A类型的一个引用,初始值为null,第二句是创建了一个对象。
下面就说明new B()
的到底干了什么?
注意:上述为单线程模式下的对象创建;如果为多线程模式下,创建的是主内存共享的对象,并发访问可能发生,读取到的是没有进行自定义初始化的不完整的对象(只完成了默认初始化),因为 a = new B();
语句编译成字节码指令一般(取决于在构造函数或者域中有没有指定值)是两条指令:new,invokespecial,其中new用来分配对象内存空间并初始化默认值,返回堆对象的引用,而invokespecial指令用来调用对象自定义初始化方法<init>,而且编译器允许这两个指令之间的重排序。
上图最后两步对应的是invokespecial指令,前面对应的是new指令。
对于单线程来说JMM保证了单线程串行执行结果的可见性顺序,所以即使发生重排序同一线程的后续语句也能获得完整初始化的对象。
1.1- 分配多少内存?
对象分配的内存空间大小在类加载时便可以完全确定,详情参见对象的内存布局
指针碰撞、空闲列表
堆内存的分配方式,堆内存的分配方式和垃圾回收策略决定
1.1.1- 指针碰撞
- 当使用Serial、ParNew等带compact压缩垃圾回收器进行垃圾回收时(内存区域是绝对规整的)
- 用过的内存和没有使用过的内存分别放在两边,中间用一个指针(地址)进行进行标示,分配内存是,就是将这个指针向未使用的空间移动对象大小的位置,然后将对象分配在这个空出来的空间上。
1.1.2- 空闲列表
- 使用CMS等基于Mark-Sweep算法的垃圾回收器时
- 堆内存空间不是规整的,用空闲列表来记录对中哪些是可用的,分配内存时就是将空闲列表中找到足够大小的内存空间来分配对象。
2- 对象的内存布局
对象创建在内存空间的布局。对象的内存区域可以分为3块:对象头、实例数据、对齐填充。
2.1- 对象头
分为两个部分:存储对象运行时数据、对象的类型指针。
运行时数据:HashCode、GC分带年龄、锁的信息。
类型指针:指向类的元数据(在方法区中)的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例,但是不一定会存储直接指针,还会通过存储句柄接持有类型指针;如果是数组对象,对象头还会有记录数组长度的数据,因为虚拟机从数组的元数据是无法确定数组的大小的。
补充:对象头的数据大小为32位(32位虚拟机)或64位(64位虚拟机未开启压缩),这个部分的数据的内部结构不是固定的,可以根据对象的状态进行复用。
类型字节: byte 1字节、short 2字节、int 4字节 、 long 8字节、char 2字节(unicode编码,可以存储一个汉字)、float 4字节 、double 8字节、boolean 1字节
2.2- 实例数据
- 这部分是对象中,实例域(而不是方法中局部变量)的数据内容(其实也是对象的引用或基本变量类型的值)。
- 不仅子类中的数据,而且父类的数据都要存储起来。
- 存储顺序按照,继承关系,和声明顺序依次存储;相同宽度的数据被分配在一起。
- 但是为了节省空间,会把子类较窄的数据插入到父类的空隙中。
2.3- 对齐填充数据
HotSpot 要求每个对象的起始地址必须是8字节的整数倍,换句话说每个对象的大小必须是8字节的整数倍,而对象头正好是8字节的整数倍,而对象的实例数据可能会有些宽度不同的数据没有对齐,这是需要对齐数据进行填充。
3- 对象的访问定位
关注的主要是对象空间中的类型指针是如何定位到类的元数据的问题。主要有两种:句柄池、直接指针访问。
3.1- 句柄
句柄池的位置:java堆中一块单独的内存空间,里面放了很多句柄。
一个句柄包含两个部分:到对象实例数据(堆上)的指针、到对象类型数据的指针(方法区上)。
-
如何通过java栈帧中的变量表reference找到其对应堆上对象数据的?
栈帧变量表reference中会保存对象的句柄地址,通过句柄地址就可以找到对象和类型的数据信息。
优点是:当对象被移动时(发生在垃圾回收时),不用修改reference的地址,只需修改句柄地址的对象实例的指针;缺点:额外占用一部分内存空间,而且需要进行两次指针访问,而且这种操作很频繁。
3.2- 直接指针访问
- reference保存的是对象在java堆上的直接地址,而对象上会保存一个对其类型信息(方法区)的指针
- 优点:速度更快,HotSpot就是使用的这种方式进行定位的