清楚认识Servlet是学习Java Web重要的一环,了解Servlet的工作机制更加容易理解一个Web项目的启动过程!
从servlet容器说起
要介绍servlet必须把servlet容器说清楚,servlet与servlet容器的关系有点像枪和子弹的关系,枪为子弹而生,而子弹又让枪有了杀伤力。
什么叫做Servlet?
Servlet是一种独立于平台和协议的服务器端的Java应用程序,可以生成动态的web页面。它担当web浏览器或者其他http客户端程序发出请求、与http服务器上的数据库或应用程序之间交互的中间层。狭义的Servlet是指Java语言实现的一个接口,广义的Servlet是指任何实现了这个Servlet接口的类,一般情况下,人们Servlet理解为后者。
什么是Servlet容器?
Servlet Container(Servlet 容器) 是 Web 服务器或者应用服务器的一部分,用于提供基于请求/响应发送模式的网络服务。Servlet容器的基本思想是在服务器端使用Java来动态生成网页。因此,Servlet容器是Web服务器和servlet进行交互的必不可少的组件。Servlet容器就是用来装Servlet的。
Tomcat既是Web服务器也是Servlet容器
Servlet的作用
- 接受请求
- 找到对应的service,调用方法,完成业务逻辑
Servlet生命周期
当servlet被部署在应用服务器中(应用服务器中用于管理Java组件的部分被抽象成为容器 )以后,由容器控制servlet的生命周期。除非特殊指定,否则在容器启动的时候,servlet是不会被加载的,servlet只会在第一次请求的时候被加载和实例化。servlet一旦被加载,一般不会从容器中删除,直至应用服务器关闭或重新启动。但当容器做内存回收动作时,servlet有可能被删除。也正是因为这个原因,第一次访问servlet所用的时间要大大多于以后访问所用的时间。
servlet在服务器的运行生命周期为,在第一次请求(或其实体被内存垃圾回收后再被访问)时被加载并执行一次初始化方法,跟着执行正式运行方法,之后会被常驻并每次被请求时直接执行正式运行方法,直到服务器关闭或被清理时执行一次销毁方法后实体销毁。
参考[Jack__Frost的博客]
和所有的Java程序一样,servlet运行在JVM中。引入servlet容器是为了处理复杂的HTTP请求。Servlet容器负责servlet的创建、执行和销毁。
在Tomcat容器等级中,Context容器直接管理Servlet在容器中的包装类Wrapper,所以Context容器如何运行将直接影响Servlet的工作方式。Tomcat容器模型如下:
Tomcat的容器分为4分等级,真正管理Servlet的容器时Context容器,一个Context对应一个Web工程,在Tomcat的配置文件可以很容易发现这一点:
Servlet容器的启动过程
Tomcat7 支持嵌入式功能,增加了一个启动类 org.apache.catalina.startup.Tomcat
。创建一个实例对象并调用 start 方法就可以很容易启动 Tomcat,还可以通过这个对象来增加和修改 Tomcat 的配置参数。下面我们就利用这个 Tomcat 类来管理新增的一个 Context 容器,我们就选择 Tomcat7 自带的 examples Web 工程,并看看它是如何加到这个 Context 容器中的。
# 创建一个 Tomcat 实例
Tomcat tomcat = getTomcatInstance();
File appDir = new File(getBuildDirectory(), "webapps/examples");
# 新增一个 Web 应用
tomcat.addWebapp(null, "/examples", appDir.getAbsolutePath());
# 启动 Tomcat
tomcat.start();
# 调用其中的一个 HelloWorldExample Servlet,看有没有正确返回预期的数据。
ByteChunk res = getUrl("http://localhost:" + getPort() +
"/examples/servlets/servlet/HelloWorldExample"); assertTrue(res.toString().indexOf("<h1>Hello World!</h1>") > 0);
一个 Web 应用对应一个 Context 容器,也就是 Servlet 运行时的 Servlet 容器,添加一个 Web 应用时将会创建一个 StandardContext 容器(StandardContext是Context的标准实现),并且给这个 Context 容器设置必要的参数,url 和 path 分别代表这个应用在 Tomcat 中的访问路径和这个应用实际的物理路径。其中最重要的一个配置是 ContextConfig,这个类将会负责整个 Web 应用配置的解析工作。最后将这个 Context 容器加到父容器 Host 中。
下面重点关注添加example应用所对应的StandardContext容器的启动过程:
当Context容器初始化状态设为init时,添加到Context容器的Listener将会被调用,ContextConfig继承了LifecycleListener接口,它是在调用Tomcat.addWebapp时被加入到StandardContext容器中的。ContextConfig类会负责整个Web应用的配置文件的解析工作。
ContextConfig 的 init 方法将会主要完成以下工作:
- 创建用于解析 xml 配置文件的 contextDigester 对象
- 读取默认 context.xml 配置文件,如果存在解析它
- 读取默认 Host 配置文件,如果存在解析它
- 读取默认 Context 自身的配置文件,如果存在解析它
- 设置 Context 的 DocBase
ContextConfig 的 init 方法完成后,Context 容器的会执行 startInternal 方法,这个方法启动逻辑比较复杂,主要包括如下几个部分:
- 创建读取资源文件的对象
- 创建 ClassLoader 对象
- 设置应用的工作目录
- 启动相关的辅助类如:logger、realm、resources 等
- 修改启动状态,通知感兴趣的观察者(Web 应用的配置)
- 子容器的初始化
- 获取 ServletContext 并设置必要的参数
- 初始化“load on startup”的 Servlet
Web应用的初始化工作
Web应用的初始化工作是在ContextConfig
的configureStart
方法中实现的,应用的初始化主要是解析web.xml
文件,这个文件描述了一个Web应用的关键信息,也是一个应用的入口。
接下来会将Web.xml对象中的属性设置到Context容器中,这里包括创建Servlet对象、filter、listener等,这段代码在Web.xml的configureContext方法中。
这段代码将Servlet包装成Context容器中的StandardWrapper,这里有个疑问,为什么要将Servlet包装成StandardWrapper而不直接包装成Servlet对象?这里StandardWrapper是Tomcat容器的一部分,它具有容器的特征,而Servlet作为一个独立的Web开发标准,不应该强耦合在Tomcat中。
- Servlet包装成StandardWrapper并作为子容器添加到Context中
- 其他的web.xml属性也都被解析到Context中
创建Servlet实例
前面已经完成了Servlet的解析工作,并且被包装成StandardWrapper添加在Context容器中,但是它仍然不能为我们工作,它没有被实例化。下面我们介绍Servlet对象如何创建的,以及如何被初始化的。
创建Servlet对象
创建Servlet实例的方法是从Wrapper.loadServlet开始的。loadServlet方法要完成的就是获取servletClass,然后把它交给InstanceManager去创建一个基于servletClass.class的对象。Servlet 顶层类关联图如下:
初始化Servlet
初始化Servlet在StandardWrapper
的initServlet方法中,这个方法很简单,就是调用Servlet的init()方法,同时把包装了StandardWrapper
对象的StandardardWrapperFacade
作为ServletConfig
传给Servlet。这样Servlet对象就初始化完了。
Servlet体系结构
我们知道 Java Web 应用是基于 Servlet 规范运转的,那么 Servlet 本身又是如何运转的呢?为何要设计成这样呢
Servlet规范就是基于上图这几个类运转的,与Servlet主动关联的是三个类,分别是ServletConfig、ServletRequest、ServletResponse。这三个类都是通过容器传递给Servlet的,其中ServletConfig在Servlet初始化时就传给Servlet了,而后两个是在请求到达时调用Servlet传递过来的
Servlet如何工作的
我们已经清楚了Servlet是如何被加载的、如何被初始化的,现在的问题就是它如何被调用的?
用户从浏览器向服务器发起的一个请求通常会包含如下信息:http://hostname: port /contextpath/servletpath
,hostname 和 port 是用来与服务器建立 TCP 连接,而后面的 URL 才是用来选择服务器中那个子容器服务用户的请求。那服务器是如何根据这个 URL 来达到正确的 Servlet 容器中的呢?
Tomcat7.0 中这件事很容易解决,因为这种映射工作有专门一个类来完成的,这个就是 org.apache.tomcat.util.http.mapper
,这个类保存了 Tomcat 的 Container 容器中的所有子容器的信息,当 org.apache.catalina.connector. Request
类在进入 Container 容器之前,mapper 将会根据这次请求的 hostnane 和 contextpath 将 host 和 context 容器设置到 Request 的 mappingData 属性中。所以当 Request 进入 Container 容器之前,它要访问那个子容器这时就已经确定了。