对象的创建
虚拟机遇到一条new指令时,首先检查指令的参数能否在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化过。如果没有,必须先执行相应的类加载过程。
接下来虚拟机为新生对象分配内存。对象所需要的内存在类加载完成后可以被完全确定,所以只需要把一块确定大小的内存区域从堆中划分出来给这个对象即可:
如果堆的内存是规整的,所有使用的内存在一边,未使用的内存在另一边,中间是一个作为分界点的指针,那分配空间只需要移动作为分界点的指针(移动距离等于该对象需要的空间)。这种方法叫“指针碰撞”(Bump the Pointer)
如果堆的内存是不规整的,那么虚拟机需要维护一个列表,记录那些内存块是可用的,在分配的时候划分一个足够大的内存块给该对象,并且更新列表的记录。这种方法叫”空闲列表“(Free List)
Java堆内存是否规整取决于所采用的垃圾收集器是否带有压缩整理的功能。
由于对象分配是非常频繁的操作,所以必须考虑线程安全问题:
方法一是同步分配空间的动作,通过采用CAS+失败重试保证更新操作的原子性。
方法二是给每个线程都分配本地线程分配缓冲TLAB,哪个线程要分配内存,就在那个线程的TLAB上分配。当线程的TLAB用完,重新分配新的TLAB时,才需要同步锁定。
分配内存后,虚拟机设置对象的一些必要信息,这些信息存在在对象的对象头中。一般来说,执行new指令后,会接着执行<init>方法,将对象初始化。这样一个真正可用的对象才算完全产生出来。
编译器为每个类生成至少一个实例初始化方法,即<init>()方法。此方法与源程序里的每个构造方法对应。如果类没有声明构造方法,则生成一个默认构造方法,该方法仅调用父类的默认构造方法,同时生成与该默认构造方法对应的<init>()方法。
<init>()方法内容大概为:
调用另一个<init>()方法(本类的另外一个<init>()方法或父类的<init>()方法);
初始化实例变量;
与其对应的构造方法内的字节码
对象的内存布局
对象在内存中的布局可以分为3块区域:对象头(header),实例数据(Instance Data)和对齐填充(Padding)。
对象头包括两部分信息:
第一部分用于存储对象自身的运行时数据。如哈希码,GC分代年龄,锁状态标志,线程持有的锁,偏向线程id,偏向时间戳等。考虑到虚拟机的空间效率,此部分在32位和64位虚拟机中只占32位或者64位的大小。
第二部分是类型指针。即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。(并不是所有的虚拟机实现都保留类型指针,查找对象 的元数据信息不一定要通过对象本身)
如果该对象是数组,那么对象头还会保留一块数据,用于记录数组长度。
接下来的实例数据是对象真正存储的有效信息,也是在代码中定义的各种类型的字段内容。这部分的存储顺序会受到虚拟机分配策略参数和字段在Java源码中定义顺序的影响。Hotspot虚拟机默认策略是longs/doubles,ints,shorts/chars,bytes/booleans,oops(Ordinary Object Pointers),相同宽度的字段总是分配到一起。在这个去前提下,父类中定义的变量会出现在子类之前。
对齐填充不是必须的,也没有特别的意义,仅仅起到占位符的作用。HotSpot的自动内存管理系统要求对象起始地址必须是8字节的整数倍。
对象的访问定位
Java程序通过栈上的reference数据来操作堆上的具体对象。由于reference类型在Java虚拟机中的规范中只规定了一个指向对象的引用,并没有定义这个引用应该通过何种方式去定位、访问堆中的对象的具体位置,在此我向大家推荐一个架构学习交流圈:830478757 帮助突破瓶颈 提升思维能力,所以对象访问方式也是取决于虚拟机的实现而定的。目前主流的访问方式有试用句柄和直接指针两种:
句柄访问。Java堆划分出一块内存作为句柄池,reference中存储的就是对象的句柄地址,句柄中包含了对象实例数据与类型数据各自的具体地址信息
直接指针访问。Java堆对象的布局中必要考虑如何防止访问类型数据的相关信息,而reference中存储的直接就是对象地址。
句柄访问的好处是reference中存储的时稳定的句柄地址,在对象被移动的时候只会改变句柄中的实例数据指针,而reference本身不需要修改。(垃圾收集时移动对象是非常普遍的行为)
直接指针访问的最大好处是速度更快,节省了一次指针定位的时间开销。
Java默认的虚拟机Hotspot使用第二种方式进行对象访问,但是句柄访问在其他实现中也很常见。