(注:本文全部深入理解Java虚拟机一书的笔记)
对象的创建
执行new指令时
- 在执行new指令之前:首先检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并检查这个符号引用代表的类是否已被加载、解析和初始化过,如果没有那必须执行相应的类加载。
- 分配内存
分配内存有两种方式:
1. 指针碰撞(Bump The Point):如果Java堆的内存空间是规整的,所有使用过的内存在一边,没有使用过的在一边,中间放一个指针作为分界点,那么分配内存就仅仅是把指针往空闲区这边移动一段距离;
2. 空闲列表(Free List):如果Java堆的空间不是规整的,虚拟机就必须维护一个列表,记录上哪些内存块是可用的。
分配内存解决并发处理的两种方式:
1. 对分配内存空间的操作进行同步处理:采用CAS配上失败重试的方式保证更新操作的原子性;
2. 把内存分配的动作按照线程划分在不同空间之中进行:每个线程在Java堆中预先分配内存,称为本地线程分配缓冲(TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步锁定 - 分配内存完成后:虚拟机必须将分配到的内存空间(不包括对象头)都初始化为零,如果使用了TLAB,这一项工作也可以提前到TLAB分配时进行。
执行完new指令后
此时从虚拟机的视角来说,一个对象已经产生。但是从Java程序的视角才刚刚开始——构造函数,Class文件中的<init>()方法还没有执行,所有字段都默认为零值,对象其他的资源信息还没有按照预定的意图构造好,一般来说,new指令执行完成之后会接着执行<init>()方法,这样一个对象才算完全构造出来。
对象的内存布局
对象在堆中的存储布局可以分为三个部分:对象头(Header)、实例数据(Instance Data)、对其填充(Padding)。
- 对象头:对象头包含两类信息。第一类是用于存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。官方称为Mark Word。另一部分是类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。
- 实例数据:对象真正存储的有效信息,即我们在程序代码里面定义的各自类型字段内容,无论是父类中间继承的还是子类中间定义的的字段都会记录起来。这部分的存储顺序会收到虚拟机分配策略参数和字段在Java源码中定义顺序的影响。
- 对其填充:不是必然存在的,没有太多意义,仅仅是占位符的作用。
对象的访问定位
Java程序会通过栈上的reference数据来操作堆上的具体对象。主流的对象访问定位方式主要有使用句柄和直接指针访问两种:
- 句柄访问:Java堆中将会划分出一块内存作为句柄池,reference数据里面存储的就是对象的句柄地址,而句柄里面包含了对象实例数据和类型数据各自的具体地址信息;
-
直接指针访问:reference里面就是存储的对象地址,这样如果只是访问对象本身的话,就不需要多一次间接访问开销(HotSpot虚拟机就主要使用的这种方法)