关于Class文件
并不是只有java文件进行编译之后会产生class文件,其他语言同时也可以在java虚拟机上进行运行。
Class类文件的结构:
Class文件是一组以8位字节为基础单位的二进制流文件,结构类似与C语言结构体的伪结构来存储,这种伪结构中只有两种数据类型,无符号数和表。
无符号数:
基本的数据类型,分别用u1,u2,u4,u8来代表1,2,4,8个字节
作用是描述数字,索引,数量值,或者按照UTF-8编码构成的字符串
表:
多个无符号数构成的符合数据类型,所有表都有字节的结构,Class文件其实就是一张大的表。
下面我们想详细说说class文件中是如何组成的.(注意,位数从0开始)
1.0-3前四个字节:魔数
魔数的作用就是来确定这个文件是否是能被虚拟机所接受的Class文件,而为什么不是使用扩展名来判断是否是class文件类型那,是因为安全,因为扩展名是可变的.
2. 4-7个字节
第四位和第五位,是文件主版本号,第六位和第七位是次版本号.,通过版本号可以确定是那个版本的虚拟机执行的
3. 8-9 常量池容量计数器(从1开始)
能够确定常量池有多少项数据
4. 常量池
常量池中包含两种常量,字面量和符号引用。
字面量:文本字符串,被final声明的常量值等。
符号引用常量:
1.类和接口的全限定名;
2.字段的名称和描述符;
3.方法的名称和描述符;
解释一下:
class文件是不会保存java文件中代码的布局的,因为编译成为class文件之后都是一堆物理上连续的二进制,所以所有的字段和方法名都需要从常量池中获取对应的符号引用(类名,修饰符名等),在在类创建或者运行时解析的时候到具体的内存地址上。
(拓展)类和接口的全限定名:
从原始的位置到类的位置,比如( class com.test.Test$NTest)包名.类名$内部类名。
4.1常量池的常量
常量池中的每一项常量都是一张表只不过,关于表结构请看图1.1.比如偏移量为 00000000A位置的就是第一个常量项,也就是A位置,如果这个位置的tag(标识符)为07,那么他就代表是CONSTANT_Class_info类型 ,他的表结构是u1+u2,也就是一共是六位字符,前两位是07的tag,后四位是name_index是会指向常量池中的之后的常量比如0002 指向第二项常量.
如果tag 为01 则为CONSTANT_Utf8_info,就是utf8编码的字符串(可能为第一项类类型常量的全限定名),而CONSTANT_Utf8_info的表结构为u1+u2+u1分别是tag+length+字符串长度,这里要注意:java中方法字段名称的最大长度就等于CONSTANT_Utf8_info中规定的length,也就是64k如果大于64k将不会被编译.
1.1常量池的项目类型
而每一种项目类型的表结构都是不同,这里列举CONSTANT_Utf8_info类型:
1.2CONSTANT_Utf8_info 表结构
tag 标识位,标志那种项目类型的常量
length 长度
bytes length长度的字节数组
CONSTANT_Utf8_info通常是作为类文件中方法,字段的符号引用,所以bytes大多数存储的都是方法,字段的名字。
5.访问标志
在常量池结束之后紧接着的连个字节代表访问标志,他将会确定这个类为public类型,是否是抽象类,是类还是接口,是否被final修饰
6.类索引,父索引,和接口索引集合:
类索引用来确定一个类的全限定名,父索引确定一个类的父类,这两个都是一组u2类型的数据;
接口索引集合用来确定一个类的实现的接口,是很多组u2类型的数据
7.字段表集合:
用来描述接口或者类中声明的变量,字段包括类级变量和实例级变量:
字段表集合可以描述一个类的修饰符,名称等
1.3字段表结构
access_flags:标识符,用来确定字段的修饰符;
name_index :常量池的引用,对应的是字段的简单名称;
descriptor_index:字段的描述符,用来描述字段的数据类型,方法参数列表,返回值。
attributes_info:属性表集合,描述字段其余的信息,比如int a=123; 123就会在属性表中进行描述。
8.方法表集合:
1.4 方法表结构
大致是跟字段表集合差不多的。不多说
attributes_info:存放方法中的代码等信息。
9.属性表集合:
字段表,方法表都可以携带属性表,用于描述某些场景专有的信息。
1.5 属性表中的属性
1.Code:存放代码,其实也是一对字节码指令(接口,或者抽象类的方法没有此属性。)
2.ConstatntValue:通知虚拟机自动为静态变量赋值。
这里有个问题:
被static修饰和被final 和 static 同时修饰的变量有什么区别?
被static和final修饰的基本变量和String类型的变量是会使用ConstantValue进行初始化操作的,其余的只被static修饰的变量或者是被static和final修饰的引用类型的变量,是会在client中进行初始化赋值的。
其余的属性这里就不一一详解了,有兴趣的可以去网上查查资料,这里就说几个比较特殊的