深入理解Tomcat——Tomcat Connector
Tomcat Connector
这篇文章主要讲了Tomcat的Connector及其源码分析
代码在 https://github.com/fanfte/HowTomcatWorks中的\src\ex04\pyrmont目录下
主要通过对Tomcat的默认连接器的分析和源码剖析理解该模块的运行机制。
Tomcat的连接器是一个独立的模块,可以被插入到servlet容器中。Tomcat中使用的连接器必须满足:
1实现org.apache.catalina.Connector接口;
2负责创建实现了org.apache.catalina.Request接口的request对象;
3负责创建实现了org.apache.catalina.Response接口的response对象;
连接器主要工作原理为:等待进入的HTTP请求,创建request和response对象,然后调用Container接口下的invoke(request, response)方法。方法内部servlet容器载入servlet类,调用它的service()方法,管理session对象,记录错误消息等操作。
默认连接器的优化:
1使用一个对象池避免频繁创建对象的性能消耗
2使用字符数组来代替字符串
HTTP1.1新特性
持久连接
HTTP1.1引入持久连接,保证浏览器请求完服务器之后不会马上断开连接。服务器可以等待客户端请求被页面所引用的所有资源,所有资源都可以使用该持久连接下载,减少了建立/关闭HTTP连接的系统开销。
HTTP1.1默认使用持久连接。显示使用方式:
浏览器请求头发送 connection:keep-alive
块编码
在HTTP1.1中服务器可以不写“content-length”头信息,往连接中写相应内容就行了,发送完响应信息后关闭连接。客户端会一直读取,直到读到-1,为文件末尾。
使用“transfer-encoding”的请求头,指明字节流会分块发送,每个块的后面会有一个回车/换行符(CR/LF)
发送两个块的例子:
一个块发送29字节,一个块发送9个字节
I'm as helpless as a kitten up a tree.
实际发送的内容为
1D\r\n
I'm as helpless as a kitten u
9\r\n
p a tree.
0\r\n
1D为十进制数29的16进制表示
0\r\n为发送事务完成标识
状态码100
客户端在不确认服务器是否会接受某个请求时,可以发送Expect:100-continue的请求头等待服务器确认。
服务器可以发送响应头:
HTTP/1.1 100 Continue
客户端接收之后,可以发送请求体,服务端读取输入流的内容。
Tomcat Connector
Connector接口
public Container getContainer();
public void setContainer(Container container);
public Request createRequest();
public Response createResponse();
}
Tomcat连接器实现Connector接口,其中最重要的四个方法如上:
setContainer()和getContainer用来将连接器和servlet容器相关联;createRequest()用于创建request对象;createResponse()用于创建response对象。
Tomcat Connector UML图
图1 默认连接器的UML类图
连接器与servlet容器是1对1的关系
HttpConnector类
实现了Runnable接口和Lifecycle接口。Lifecycle接口维护每个实现了该接口的Catalina组建的生命周期。创建HttpConnector实例后应该调用initialize()方法和start()方法,并且在组件的整个生命周期只被调用一次。
1.创建服务端套接字
initialize()方法调用一个open()方法,返回一个serverSocket实例。open()方法通过服务端ServerSocketFactory工厂方法获取serverSocket
2.维护HttpProcessor实例
HttpConnector对象有一个HttpProcessor对象池,每个HttpProcessor实例都运行在其自己的线程中。可以通过对象池处理多个HTTP请求。
对象池通过一个private Stack processors = new Stack();实现
还有两个变量minProcessors和maxProcessors来维护HttpProcessor的实例个数。
3.提供HTTP请求服务
HttpConnector类的主要业务逻辑在run()方法中,包含一个while循环。通过serverSocket.accept()来等待请求接入。
通过createProcessor()方法获取一个处理器processor。若processors池(也即上文的stack)中不为空,则弹出一个实例。否则判断创建的实例数量是否超过最大值,没有超过则创建一个HttpProcessor,否则返回null,这时,服务器关闭这个socket,不对本次请求进行处理。
如果取到processor不为空,则调用processor对象的assign()方法处理请求。该方法中首先判断某个available状态,初试值为false,则processor线程进入wait状态。下文将详细分析该过程。
HttpProcessor类
HttpProcessor实现了Runnable接口,该run()方法称为“处理器线程”。每个HttpConnector对象创建HttpProcessor实例后,调用start()方法,启动HttpProcessor的处理线程。
以下为HttpProcessor的run()方法:
while (!stopped) {
// 等待socket接入
Socket socket = await();
if (socket == null)
continue;
// 处理socket请求
try {
process(socket);
} catch (Throwable t) {
log("process.invoke", t);
}
// 完成处理,将processor实例压栈回收
connector.recycle(this);
}
// Tell threadStop() we have shut ourselves down successfully
synchronized (threadSync) {
threadSync.notifyAll();
}
}
其中的await方法如下:
private synchronized Socket await() {
// 初始available为false,则调用await等待就绪请求
while (!available) {
try {
wait();
} catch (InterruptedException e) {
}
}
// 将全局的socket保存局部变量,以便全局socket可以接收新的请求
Socket socket = this.socket;
available = false;
// 唤醒connector
notifyAll();
if ((debug >= 1) && (socket != null))
log(" The incoming request has been awaited");
return (socket);
}
该await()方法是和HttpProcessor的assign方法协工作的,而在前文说过,assign方法是在HttpConnector的run()方法中调用,在新连接socket接入之后通过processor.assign(socket);进行处理新连接请求的。
assign方法代码如下:
synchronized void assign(Socket socket) {
// Wait for the Processor to get the previous Socket
while (available) {
try {
wait();
} catch (InterruptedException e) {
}
}
// 保存新连接socket并且唤醒processor线程
this.socket = socket;
available = true;
notifyAll();
if ((debug >= 1) && (socket != null))
log(" An incoming request is being assigned");
}
assign和await都是HttpProcessor的方法,而assign在Connector线程中被调用,await在HttpProcessor初始化时被调用,所以是在两个线程被调用的。
处理器线程启动,也即进入上面HttpProcessor的run()方法时,available变量为false,处理器线程进入wait状态,等待其他线程notify唤醒。而连接器线程一旦获取到了可用的新连接,则保存该新连接并设置available = true,然后调用notifyAll()唤醒processor线程。此时processor保存新连接的socket并返回给处理器线程执行下面的逻辑,也即HttpProcessor中run方法的剩余部分。
处理请求
处理请求分为:解析连接,解析请求,解析请求头的过程。分别在parseConnection(),parseRequest(input, output),parseHeaders(input)中实现,具体详细看代码。
Container应用
容器处理代码通过connector.getContainer().invoke(request, response);来调用。
SimpleContainer实现了Container接口,其中最关键的invoke()方法如下:
public void invoke(Request request, Response response)
throws IOException, ServletException {
// 获取servlet名称
String servletName = ((HttpServletRequest) request).getRequestURI();
servletName = servletName.substring(servletName.lastIndexOf("/") + 1);
URLClassLoader loader = null;
try {
URL[] urls = new URL[1];
URLStreamHandler streamHandler = null;
File classPath = new File(WEB_ROOT);
String repository = (new URL("file", null, classPath.getCanonicalPath() + File.separator)).toString();
urls[0] = new URL(null, repository, streamHandler);
loader = new URLClassLoader(urls);
} catch (IOException e) {
System.out.println(e.toString());
}
Class myClass = null;
try {
// 使用类加载器加载Servlet
myClass = loader.loadClass(servletName);
} catch (ClassNotFoundException e) {
System.out.println(e.toString());
}
Servlet servlet = null;
try {
// 反射创建Servlet对象
servlet = (Servlet) myClass.newInstance();
// 调用Servlet的service()方法完成请求的响应
servlet.service((HttpServletRequest) request, (HttpServletResponse) response);
} catch (Exception e) {
System.out.println(e.toString());
} catch (Throwable e) {
System.out.println(e.toString());
}
}
本文主要讲了Tomcat的默认连接器Connector的结构和处理流程,以及和Processor的关系,具体的源码可以下载之后详细阅读。
本文到此为止了,bye.