认识Class -- 终于不在怂

引子

     本是新年,怎奈新冠肆掠,路上行人,男女老少几乎是全副口罩,形色匆匆;偶尔有一两个裸露口鼻的,估计都是没囤到口罩的,这几天药店几乎都是贴上大字:口罩没货。看着网络上病毒消息满天飞,我也响应在家做贡献的号召。上班时,都是早出晚归,几乎只有早上能看到娃,出门时,娃每次都说:see you tomorrow 。赶上疫情,天天在家带娃,终于可以多多陪伴了;别说,带娃还真比上班费神。想着小时候,特别想有一个玩具小船,动手给娃做了一个,附图一张。把娃带好了,也得思考下学习的事儿。学习java有段时间了,想起之前学习java时,看着Class<?> 这样的符号就怵,不明白其表示的含义,又重读《java编程思想》第14章, 趁着这样的时间好好整理了一下,直面当时的怵。

Class对象

  Class<?> - 类的类型,是运行时类型信息,也就是 RTTI - RTTI - RunTime Type Infomation;所谓一切皆对象,类也是一个对象,而类的类型信息,就叫做Class对象。RTTI使得我们可以在运行时发现和使用类型信息。以前觉得RTTI离我很远(java菜鸟),其实多态机制正是因为类对象携带了类的类型信息,在类型转化时可以识别到对象的类型。举个栗子,如下, ChildClassTest向上转型为 SuperClassTest时,丢失了子类类型信息,而运行时,向下转型时,又使用RTTI 获取了实际类型,从而可以正常打印出 ChildClassTest。但是,为什么向上转型丢失类型信息,再向下转型时,可以获取到实际的类型,这要从RTTI 的工作原理说起了。

publicclass SuperClassTest {

}

publicclassChildClassTestextends SuperClassTest {

}

SuperClassTest superClassTest = new ChildClassTest();

PrintTool.print(superClassTest);

#打印

com.hj.tool.klass.ChildClassTest@685f4c2e

RTTI的工作原理

  前面的例子中,这种在运行时,确定类的实际类型是虚拟机的动态分派机制。 为啥对象可以找到类型信息呢,因为普通对象是被Class对象创建的,而Class对象包含了类的有关信息。下图为Class对象的加载过程,当我们在创建普通对象时,会先判断此类的Class对象是否加载(每个类都有一个Class对象),如果已经加载,就使用Class对象生成普通对象;如果未加载,就需要通过字节码创建Class对象,再生成普通对象。在虚拟机层面,则是运行时,把变量 new ChildClassTest()的引用存放于 LocalVariableTable 的 slot中,执行print时(其实就是执行toString()方法),实际是执行invokevirtual 指令,找到方法的实际接收者,再执行toString()。而 invokevirtual 解析的过程,根据《深入理解java虚拟机》中的描述过程如下:

1)找到操作数栈顶的第一个元素所指向的对象的实际类型,记作C。

2)如果在类型C中找到与常量中的描述符和简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回java.lang.IllegalAccessError异常。

3)否则,按照继承关系从下往上依次对C的各个父类进行第2步的搜索和验证过程。

4)如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。由于invokevirtual指令执行的第一步就是在运行期确定接收者的实际类型,所以两次调用中的invokevirtual指令把常量池中的类方法符号引用解析到了不同的直接引用上,

这个过程就是Java语言中方法重写的本质。我们把这种在运行期根据实际类型确定方法执行版本的分派过程称为动态分派。


Class文件结构

      既然Class对象来源于字节码,那就来分析下.class文件的内容,引用《java虚拟机规范》中关于classFile的格式如下:“每个class文件都由字节流组成,每个字节含有8个二进制位。所有16位,32位,64位长度的数据将通过构造成2个,4个,8个连续的8位字节来表示。”规范中定义了每个项的字节长度,以及结构,分析的过程还是挺有意思的:原来我们写的代码都被编译成那样的格式。说来也惭愧,java用了这么久,连一个简单的.class文件都没有分析过。

  每个class文件都对应如下结构(JDK 8,不同版本结构不是完全一样),其中包括两类数据类型:u(1/2/4), _info; u 后面的数字表示n个字节,而 每个_info 又有特定的格式。 具体可以参看《java虚拟机规范 se 8》第4章内容。

   我们来看下具体的一个类,

package com.hj.tool.klass;

/** * @Description TODO

* @Author jijunjian

* @Date 2020-01-27 20:47

* @Version 1.0

*/publicclass ByteCodeTest {

    privateint m ;

    publicint inc(){

        returnm+1;

    }

}

      使用xxd  ByteCodeTest.class 查看编译后的.class文件(16进制),得到如下内容。乍一看,是不是完全看不到,我们的类是如何组织的哇。等我们按class文件的格式整理后,情况就完全不一样了。

cafe babe 0000 0034 0016 0a00 0400 12090003 0013 0700 1407 0015 0100 016d 01000149 0100 063c 696e 6974 3e01 0003 28295601 0004 436f 6465 0100 0f4c 696e 654e756d 6265 7254 6162 6c65 0100 124c 6f63616c 5661 7269 6162 6c65 5461 626c 65010004 7468 6973 0100 204c 636f 6d2f 686a2f74 6f6f 6c2f 6b6c 6173 732f 4279 7465436f 6465 5465 7374 3b01 0003 696e 63010003 2829 4901 000a 536f 7572 6365 46696c65 0100 1142 7974 6543 6f64 6554 6573742e 6a61 7661 0c00 0700 080c 0005 00060100 1e63 6f6d 2f68 6a2f 746f 6f6c 2f6b6c61 7373 2f42 7974 6543 6f64 6554 65737401 0010 6a61 7661 2f6c 616e 672f 4f626a65 6374 0021 0003 0004 0000 0001 00020005 0006 0000 0002 0001 0007 0008 00010009 0000 002f 0001 0001 0000 0005 2ab70001 b100 0000 0200 0a00 0000 0600 01000000 0900 0b00 0000 0c00 0100 0000 05000c00 0d00 0000 0100 0e00 0f00 0100 09000000 3100 0200 0100 0000 072a b400 020460ac 0000 0002 000a 0000 0006 0001 0000000e 000b 0000 000c 0001 0000 0007 000c000d 0000 0001 0010 0000 0002 0011

以下是整理后的结果,这个过程还是需要些耐心的。但是这个时间花得决绝物超所值。我解析了大部分内容,基本都注释了,其中常量池占了很多内容,但其实是最简单部分,method中关于code属性是比较麻烦的。不同版本编译得到的内容可能会有不同。

#魔数

cafe babe

#版本 jdk 8

0000 0034

# 常量池有21 个,第一个,是保留

0016

# 第一个常量

CONSTANT_Methodref_info{

u1 tag //10

u2 class_index //指向CONSTANT_Class_info;表示类

u2 name_and_type_index //指向CONSTANT_NameAndType,表示方法名、方法描述符

}

0a    tag 10

0004  class_index 指向 4

0012  name_and_type_index 指向 18

# 第二个常量 tag=9

CONSTANT_Fieldref_info{

u1 tag //9

u2 class_index //指向CONSTANT_Class_info;既可以表示类、也可以表示接口

u2 name_and_type_index //指向CONSTANT_NameAndType,表示字段名、字段描述符

}

09  tag 9

0003  class_index  指向 3

0013  name_and_type_index  指向19

# 第三个常量 tag=7

CONSTANT_Class_info{

u1 tag //tag=7

u2 name_index // name_index是索引值,指向CONSTANT_Utf8_info

}

07 tag 7

0014 name_index 指向 20 com/hj/tool/klass/ByteCodeTest

# 第4个常量 tag=7

07

0015  name_index 指向 21

# 第5个常量 tag=01

CONSTANT_Utf8_info{

u1 tag //1

u2 length

u1 bytes[length] //长度为length的字符串数组

}

01 tag

0001 length

6d asc 109=m

# 第6个常量 tag=01

01

0001 length

49 asc 73 I 表示int

# 第7个常量 tag=01

01

0006

3c 69 6e 69 74 3e  <init>

# 第8个常量 tag=01 utf8 字符串数组

01

0003

28 29 56  ()V

# 第9个常量 tag=01 utf8 字符串数组

01

0004

43 6f 64 65  Code

# 第10个常量 tag=01 utf8 字符串数组

01

000f  length=15

4c 69 6e 65  Line

4e 75 6d 62 65 72  number

54 61 62 6c 65 Table

# 第11个常量 tag=01 utf8 字符串数组

01

0012

4c 6f 63 LocalVariableTable

61 6c 56

61 72 69

61 62 6c

65 54 61

62 6c 65

# 第12个常量 tag=01 utf8 字符串数组

01

0004

74 68 69 73  this

# 第13个常量 tag=01 utf8 字符串数组

01

0020

4c 63 6f 6d

2f 68 6a 2f

74 6f 6f

6c 2f 6b 6c

61 73 73 2f

42 79 74 65

43 6f 64 65

54 65 73 74

3b

Lcom/hj/tool/klass/ByteCodeTest;

3b=;

# 第14个常量 tag=01 utf8 字符串数组

01

0003

69 6e 63  inc

# 第15个常量 tag=01 utf8 字符串数组

01

0003

28 29 49  ()I

# 第16个常量 tag=01 utf8 字符串数组

01

000a

53 6f 75 72 63 65 46 69

6c 65 

SourceFile

# 第17个常量 tag=01 utf8 字符串数组

01

0011  17个

42

79 74 65 43 6f 64 65 54 65 73

74 2e 6a 61 76 61

ByteCodeTest.java

# 第18个常量 tag=12  NameAndType

CONSTANT_NameAndType{

u1 tag //12

u2 name_index //指向CONSTANT_Utf8_info,表示名称

u2 descriptor_index //指向CONSTANT_Utf8_info,表示描述符

}

0c tag 12 nameAndType

0007 name_index  指向第7个常量  <init>

0008 descriptor_index 指向第8个常量 ()V

# 第19个常量 tag=12 NameAndType

0c

0005  m

0006  I

# 第20个常量 tag=01 utf8 字符串数组

01

001e

63 6f 6d 2f

68 6a 2f

74 6f 6f 6c 2f

6b

6c 61 73 73 2f 42 79 74 65 43 6f 64

65 54 65 73 74

com/hj/tool/klass/ByteCodeTest

# 第21个常量 tag=01 utf8 字符串数组

01

0010

6a 61 76 61 2f 6c 61 6e

67 2f 4f 62 6a 65 63 74

java/lang/Object

access_flags

0021  表示是public ,是1.2以后所以21

类索引,父类索引,接口索引

0003  类索引 2字节 指向第三个常量 class-info 又指向 和指向第20个

com/hj/tool/klass/ByteCodeTest

0004  父类索引 2字节 同理指向 java/lang/Object

0000  接口索引 无

0001 field_count u2 1个

field_info[1]

field_info{

u2 access_flags //表示字段的访问权限、属性

u2 name_index //对常量池的索引

u2 descriptor_index //对常量池的索引

u2 attributes_count //附加属性的数量

attribute_info attributes[attributes_count] //每个成员是attribute_info结构

}

0002  private

0005 name_index m

0006 descriptor_index I

0000 attributes_count 0

0002 method_count

method_info{

u2 access_flags //表示方法的访问权限、属性

u2 name_index //对常量池的索引

u2 descriptor_index //对常量池的索引

u2 attributes_count//附加属性的数量

attribute_info attributes[attributes_count] //每个成员是attribute_info结构

}

# 第一个 method init

0001  access_flags public

0007  name_index  <init>

0008  descriptor_index ()V

0001  attributes_count 1

attribute_info{

u2 attribute_name_index //常量池索引

u4 attribute_length

u1 info[attribute_length]

}

0009 attribute_name_index Code

0000 002f attribute_length 47

0001 max_stack

0001 max_locals

0000 0005 code_attribute_length

2a

b7

0001 b100

00 00 02 00 0a 00

00 00 06 00 01 00 00 00 09 00

0b 00 00 00 0c 00 01 00 00 00

05 00 0c 00 0d 00 00

# 第二个method

0001 access_flags  public

000e name_index 14 inc

000f descriptor_index 15 ()I

0001 attributes_count 1

attribute_info

0009 attribute_name_index Code

0000 0031 attribute_length 49

00 02  max_stack

00 01  max_locals 一个

00 00  00 07  code_length 7

2a aload_0 将第一个引用类型的本地变量

b4 getfield 获取指定类型的实例字段 m

#下面这两个指令没弄明白是啥意思,

00 nop 不做

02 iconst_ml 将-1 推到栈顶

04 iconst_1  将1 推到栈顶

60 iadd 将栈顶两个相加,结果压入栈顶

ac ireturn 返回int

00 00  exception_table_length

00 02  attritutes_count 2

00 0a LineNumberTable

00 00 00 06 length=6

00 01 00 00 00 0e

00 0b LocalVariableTable

00 00 00 0c length =12

00 01 00

00 00 07

00 0c 00

0d 00 00

0001  attributes_count 1

0010  attribute_name_index 16 SourceFile

0000 0002 attribute_length 2

0011 sourcefile_index 17 指向常量池中 ByteCodeTest.java

结语

  文章写到这里,感觉非常艰难,一是感觉写得不知所云,估计只有自己能明白,二是感觉自己的理解还很浅显。没动手之前,感觉啥都理解了,真正开始动手吧,又感觉啥都没理解。这便是从输入到输出的真实过程;读只是输入,无法形成真正的理解,只有持续输出才能真正领悟,而这个输出的过程才是消化的过程。写得过程中,又不断翻阅资料,把原来点点的理解,连接成断断续续的线,希望以后可以再深入学习,把这些点点的东西,连成线,汇成面。

   成为一名优秀的程序员!

      文章参考了很多《jjava编程思想》,《java虚拟机规范 se 8》,《深入理解java虚拟机》第二版中的内容。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容