从头开始学习->JVM(四):类加载器(中)

前言

上一篇文章,我们了解到类的加载流程,是由加载,验证,准备,解析,初始化这5个阶段组成的。我们也对这5个阶段进行了较为详细的解读,在这个解读的过程中,我们发现,类加载器主要是在加载阶段起到了作用。当然,我们当时没有对类加载器有进一步的了解,而今天的这篇文章,就主要集中在了类加载器身上。

在文章开始之前,我们要先明白一件事情,即便我们对类加载器有了深刻的了解,也不代表着我们对类加载的整个流程有了多大的认知,这只能说是我们在JVM这个浩瀚的海洋中,捞取了小小的一瓢水而已,微不足道,且无足挂齿。所有我们要抱着一颗谦虚的心态,去不停的学习,时时刻刻的进步。

发散的差不多了,接下来,让我们正式进入到类加载器的世界吧。

类加载器的缘来

类加载器是从jdk1.0就已经出现了,最初是为了满足 Java Applet 的需要而开发出来的。

Applet可以翻译为小应用程序,Java Applet就是用Java语言编写的这样的一些小应用程序,它们可以直接嵌入到网页中,并能够产生特殊的效果。包含Applet的网页被称为Java-powered页,可以称其为Java支持的网页。

也因此,Java Applet需要从远程网络中下载java类文件到浏览器中并执行,那么,如何保证java类文件是合法的,是符合规范的呢?于是java就创造了applet类加载器来将java文件载入,applet类加载器会保证来自文件系统的类有唯一的名称空间,来自网络资源的类有唯一的名称空间。

当浏览器通过网络载入applet的时候,applet的类被放置于和applet的源相关联的私有的名称空间中。然后,那些被类加载器载入进来的类都是通过了验证器验证的。验证器会检查类文件格式是否遵守Java语言规范,确保不会出现堆栈溢出(stackoverflow)或者下溢(underflow),传递给字节码指令的参数是正确的。

今天用在浏览器上的Java Applet技术基本上已经被淘汰,但类加载器却在类层次划分、OSGi、程序热部署、代码加密等领域大放异彩,成为Java 技术体系中一块重要的基石。

类加载器的作用

什么是类加载器?从我个人的理解来看,类加载器用来加载java类到JVM中。

在官方的文档里面写道:类加载器就是把类文件加载到虚拟机中,也就是说通过一个类的全限定名来获取描述该类的二进制字节流。

在这里必须要说一下,什么是java类的全限定名。就拿我们最经常用的String类来说,它的全限定名是
“java.lang.String”,也就是说,java类的全限定名是:包名+类名。

与之对应的就是java的非限定类名,也叫短名,也就是我们说的类名,例如:String。

一般来说,java源程序,也就是java文件通过java编译器编译之后就会被转换成java字节码(.class文件,也就是字节代码,它的表现形式是字节数组byte[]),而我们的类加载器呢,就是负责读取java字节码代码,并且转换成java.lang.Class类的一个实例(这个过程,就是类的加载流程中一个步骤:加载),并且将这个class对象加载到虚拟机的内存中。
<table><tr><td>

什么是java.lang.Class类?

Java的基本思想之一是万事万物即对象,类也是一种对象。但是类是什么对象呢?Java中的类是java.lang.Class的实例化对象,这被成为类类型。

Java程序在运行时,Java运行时系统一直对所有的对象进行所谓的运行时类型标识。这项信息纪录了每个对象所属的类。虚拟机通常使用运行时类型信息选准正确方法去执行,用来保存这些类型信息的类是Class类。Class类封装一个对象和接口运行时的状态,当装载类时,Class类型的对象自动创建。

Class 没有公共构造方法。Class 对象是在加载类时由 Java 虚拟机以及通过调用类加载器中的 defineClass 方法自动构造的,因此不能显式地声明一个Class对象。

虚拟机为每种类型管理一个独一无二的Class对象。也就是说,每个类(型)都有一个Class对象。运行程序时,Java虚拟机(JVM)首先检查是否所要加载的类对应的Class对象是否已经加载。如果没有加载,JVM就会根据类名查找.class文件,并将其Class对象载入。
</td></tr></table>

当需要使用某个类时(因此我们要知道,在java中,类是按照需要才会加载的),类加载器将会加载它的".class"文件,并创建对应的class对象,将class文件加载到虚拟机的内存。

因此,每个这样的实例用来表示一个java类,通过此实例的newInstance()方法就可以创建出该类的一个对象。

类加载器虽然只用于实现类的加载动作,但它在Java程序中起到的作用却远超类加载阶段。对于任意一个类,都必须由加载它的类加载器和这个类本身一起共同确立其在Java虚拟机中的唯一性,每一个类加载器,都拥有一个独立的类名称空间。这句话可以表达得更通俗一些:比较两个类是否“相等”,只有在这两个类是由同一个类加载器加载的前提下才有意义,否则,即使这两个类来源于同一个Class文件,被同一个Java虚拟机加载,只要加载它们的类加载器不同,那这两个类就必定不相等。

类加载器的种类

站在Java虚拟机的角度来看,只存在两种不同的类加载器:一种是启动类加载器(Bootstrap ClassLoader),这个类加载器使用C++语言实现,是虚拟机自身的一部分;另外一种就是其他所有的类加载器,这些类加载器都由Java语言实现,独立存在于虚拟机外部,并且全都继承自抽象类 java.lang.ClassLoader。

但是,一般来说,我们会把类加载器分的更加细致一点,在我们开发人员看来,在JVM中,类加载一般分为了三种,然后除了JVM自带的三种类加载器以外,还有我们用户自己可以创建开发的类加载器,从这个角度来看,类加载器是有四种。那么,类加载器都是哪四种呢?

1. 启动类加载器(Bootstrap Class Loader)

启动类加载器属于虚拟机的一部分,它是用C++写的,看不到源码,是属于java虚拟机的一部分,而其他类加载器是用Java写的,还能看到源码的。

这个类加载器负责加载存放在 <JAVA_HOME>\lib目录,或者被-Xbootclasspath参数所指定的路径中存放的,而且是Java虚拟机能够识别的(按照文件名识别,如rt.jar、tools.jar,名字不符合的类库即使放在lib目录中也不会被加载)类库加载到虚拟机的内存中。

启动类加载器无法被Java程序直接引用,用户在编写自定义类加载器时, 如果需要把加载请求委派给启动类加载器去处理,那直接使用null代替即可。

2. 扩展类加载器(Extention Class Loader)

扩展类加载器是指JVM实现的 sun.misc.Launcher $ ExtClassLoader类,由Java语言实现的,是Launcher的静态内部类。
[图片上传失败...(image-3ef66-1612228935281)]


image

主要加载JAVA中的一些拓展类,java.ext.dirs目录中加载类库,或者从JDK安装目录:jre/lib/ext目录下加载类库,是启动类加载器的子类。

这是一种Java系统类库的扩展机制,JDK的开发团队允许用户将具有通用性的类库放置在ext目录里以扩展Java SE的功能,在JDK9之后,这种扩展机制被模块化带来的天然的扩展能力所取代。由于扩展类加载器是由Java代码实现的,开发者可以直接在程序中使用扩展类加载器来加载Class文件。

3. 应用程序类加载器(Application Class Loader)

Java语言编写,由sun.misc.Launcher$AppClassLoader实现。派生继承自java.lang.ClassLoader,父类加载器为启动类加载器。


image

image

它负责加载环境变量classpath或者系统属性java.class.path指定路径下的类库,它是程序中默认的类加载器,我们Java程序中的类,都是由它加载完成的。我们可以通过ClassLoader#getSystemClassLoader()获取并操作这个加载器。

由于应用程序类加载器是ClassLoader类中的getSystemClassLoader()方法的返回值,所以有些场合中也称它为“系统类加载器”。它负责加载用户类路径 (ClassPath)上所有的类库,开发者同样可以直接在代码中使用这个类加载器。如果应用程序中没有自定义过自己的类加载器,一般情况下这个就是程序中默认的类加载器。

4. 自定义类加载器(User Class Loader)

jdk9之前的java应用都是以上的三种类加载器相互配合来完成加载的,如果用户觉得有必要,还可以自己定义类加载器来进行拓展。

而一般来说,加入自己定义的类加载器的目的如下(不是全部情况,仅是举例说明):

  1. 增加除了磁盘位置之外的Class文件来源。
  2. 通过类加载器实现类的隔离、重载等功能。
  3. 网络加载Java类,为了保证传输中的安全性,采用了加密操作,那么以上3种加载器就无法加载这个类,这时候就需要自定义加载器。

那么,如何自定义类加载器呢?

  1. 继承java.lang.ClassLoader类,重写findClass()方法
  2. 如果没有太复杂的需求,可以直接继承URLClassLoader类,重写loadClass方法,具体可参考AppClassLoader和ExtClassLoader(我在上面已经截图说明了,请注意,这种方案会打破双亲委派模型)。

什么时候进行类加载

  1. 创建类的实例,也就是new一个对象
  2. 访问某个类或接口的静态变量,或者对该静态变量赋值
  3. 调用类的静态方法
  4. 反射(Class.forName("com.lyj.load"))
  5. 初始化一个类的子类(会首先初始化子类的父类)
  6. JVM启动时标明的启动类,即文件名和类名相同的那个类
    除此之外,下面几种情形需要特别指出:

对于一个final类型的静态变量(这种情况在上一篇文章有提及过《从头开始学习JVM(三):类加载器(上)》),如果该变量的值在编译时就可以确定下来,那么这个变量相当于“宏变量”。Java编译器会在编译时直接把这个变量出现的地方替换成它的值,因此即使程序使用该静态变量,也不会导致该类的初始化。反之,如果final类型的静态Field的值不能在编译时确定下来,则必须等到运行时才可以确定该变量的值,如果通过该类来访问它的静态变量,则会导致该类被初始化。

双亲委派模型

双亲委派模型,其实就是设置的和加载器相关的加载器加载类的优先级顺序问题。

既然说到双亲委派模型,那么先来看一张超级经典的图。图如下:


image

从图中我们看到,加载器的加载必然是有一个前后顺序的,而这个顺序就是双亲委派模型。

那么,什么是双亲委派模型呢?

如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到最顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去完成加载。

那么,使用双亲委派模型的好处是什么呢?

  1. 避免重复加载。当父亲已经加载了该类时,就没有必要子类加载器再加载一次,从而造成了资源上的浪费,也能保证java核心api加载的类的唯一性,保证了程序的基本行为和逻辑。
  2. 保证java核心的api不会随意的被替换,保证了一定的安全性。假如我们通过网络传递一个名为java.lang.Integer的类,通过双亲委派模型传递到启动类bootstrap加载器,然后启动类bootstrap加载器在核心java的api中发现了这个名字的类,发现这个类已经被加载了,那么就不会再加载这个类,这也就保证了java的核心api库被随意篡改。

当然,JVM并没有将双亲委派机制当作是一个具有强制性约束的规则,这只是java推荐的一个类加载实现方式,在大部分的时候,这个模型都是能满足用户的所有请求的,但是总有一些时候,我们会发现,这个模型可能不能满足我们的要求。

比如说一下几点的出现,就可能导致双亲委派模型不能满足我们的要求:

  1. 代码热替换。
  2. 模块热部署。
  3. 需要调用由其他厂商实现并部署在应用程序的ClassPath下的JNDI服务提供者接口(Service Provider Interface,SPI)的代码。

当然,这些功能是都需要特地去实现,也是一个仁者见仁智者见智的问题,但是JVM在jdk6的时候已经将第三点解决了,方式是JDK提供了 java.util.ServiceLoader类,以META-INF/services中的配置信息,辅以责任链模式,这才算是给这些类的加载提供了一种相对合理的解决方案。

但是如果是第一点和第二点这些涉及到了热更新热部署的情况,那么我们就不得不去学会破坏双亲委派模型了。

那么问题就来了,如何破坏双亲委派模型呢?

在这里我举两个例子说明一下:

  1. 原生的JDBC中Driver驱动本身只是一个接口,并没有具体的实现,具体的实现是由不同数据库类型去实现的。例如,MySQL的mysql-connector-.jar中的Driver类具体实现的。 原生的JDBC中的类是放在rt.jar包的,是由启动类加载器进行类加载的,在JDBC中的Driver类中需要动态去加载不同数据库类型的Driver类,而mysql-connector-.jar中的Driver类是用户自己写的代码,那启动类加载器肯定是不能进行加载的,既然是自己编写的代码,那就需要由应用程序启动类去进行类加载。于是乎,这个时候就引入线程上下文件类加载器(Thread Context ClassLoader)。有了这个东西之后,程序就可以把原本需要由启动类加载器进行加载的类,由应用程序类加载器去进行加载了。

  2. OSGi实现模块化热部署的关键则是它自定义的类加载器机制的实现。每一个程序模块(Bundle)都有一个自己的类加载器,当需要更换一个Bundle时,就把Bundle连同类加载器一起换掉以实现代码的热替换。在OSGi幻境下,类加载器不再是双亲委派模型中的树状结构,而是进一步发展为更加复杂的网状结构,当受到类加载请求时,OSGi将按照下面的顺序进行类搜索:

        1.1 将java.*开头的类委派给父类加载器加载。
        1.2 否则,将委派列表名单内的类委派给父类加载器加载。
        1.3 否则,将Import列表中的类委派给Export这个类的Bundle的类加载器加载。
        1.4 否则,查找当前Bundle的ClassPath,使用自己的类加载器加载。
        1.5 否则,查找类是否在自己的Fragment Bundle中,如果在,则委派给Fragment Bundle的类加载器加载。
        1.6 否则,查找Dynamic Import列表的Bundle,委派给对应Bundle的类加载器加载。
        1.7 否则,类加载器失败。

我们在这两个例子中发现了,想打破双亲委派机制,有两个方法:

  1. 自定义类加载器,重写loadClass方法。
  2. 使用线程上下文类加载器。

<table><tr><td>

什么是线程上下文类加载器?

线程上下文类加载器(context class loader)是从 JDK 1.2 开始引入的。类 java.lang.Thread中的方法 getContextClassLoader()和 setContextClassLoader(ClassLoader cl)用来获取和设置线程的上下文类加载器。如果没有通过 setContextClassLoader(ClassLoader cl)方法进行设置的话,线程将继承其父线程的上下文类加载器。Java 应用运行的初始线程的上下文类加载器是系统类加载器。在线程中运行的代码可以通过此类加载器来加载类和资源。
</td></tr></table>

类加载器的代理模式

类加载器在尝试自己去查找某个类的字节代码并定义它时,会先代理给其父类加载器,由父类加载器先去尝试加载这个类,依次类推。

在介绍代理模式背后的动机之前,首先需要说明一下 JVM是如何判定两个 Java 类是相同的。

在上面说到双亲委派机制的时候,我们知道,JVM不仅要看类的全名是否相同,还要看加载这个类的类加载器是否一样。只有两者都相同的情况,才认为两个类是相同的。即便是同样的字节代码,被不同的类加载器加载之后所得到的类,也是不同的。

比如一个 Java 类 com.example.Sample ,编译之后生成了字节代码文件 Sample.class 。两个不同的类加载器 ClassLoaderA 和 ClassLoaderB 分别读取了这个 Sample.class 文件,并定义出两个 java.lang.Class 类的实例来表示这个类。这两个实例是不相同的。对于 Java 虚拟机来说,它们是不同的类。试图对这两个类的对象进行相互赋值,会抛出运行时异常 ClassCastException 。

了解了这一点之后,就可以理解代理模式的设计动机了。

代理模式是为了保证 Java 核心库的类型安全。所有 Java 应用都至少需要引用 java.lang.Object 类,也就是说在运行的时候, java.lang.Object 这个类需要被加载到 Java 虚拟机中。如果这个加载过程由 Java 应用自己的类加载器来完成的话,很可能就存在多个版本的 java.lang.Object 类,而且这些类之间是不兼容的。通过代理模式,对于 Java 核心库的类的加载工作由引导类加载器来统一完成,保证了 Java 应用所使用的都是同一个版本的 Java 核心库的类,是互相兼容的。

不同的类加载器为相同名称的类创建了额外的名称空间。相同名称的类可以并存在 Java 虚拟机中,只需要用不同的类加载器来加载它们即可。不同类加载器加载的类之间是不兼容的,这就相当于在 Java 虚拟机内部创建了一个个相互隔离的 Java 类空间。

总结

当我们在学习类加载器的时候,我们会发现,其实我们对java底层的代码,很明显是非常的不熟悉。我们要意识到,所谓的JVM其实只是概念上的东西,而去实现JVM的,其实就是我们底层的java代码。

比如,我们的ExtClassLoad,AppClassLoad,这两个加载器,其实都是java底层的一个类Launcher的静态内部类。

因此,如果我们仅仅只是对JVM的一些理论牢记于心的话,那就只能说我们对JVM有了一些肤浅的了解,算不上有多深入。

下一篇文章,《从头开始学习JVM(五):类加载器(下)》,我将会尝试讲解关于类加载器的底层代码,以及自己手写属于自己的类加载器。

参考博客

https://blog.csdn.net/m0_38075425/article/details/81627349

https://blog.csdn.net/javazejian/article/details/73413292

https://developer.ibm.com/zh/articles/j-lo-classloader/

参考书籍

周志明《深入理解java虚拟机》

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353

推荐阅读更多精彩内容