项目使用了HttpClient发送faiss请求,现在简单了解其源码,以便分析和优化它的性能。
解读HttpClient源码的文章:http://www.educity.cn/wenda/147389.html(老版本)
4.3版本 https://blog.csdn.net/zstu_cc/article/details/46804161
HttpClient -> CloseableHttpClient -> InternalHttpClient 。InternalHttpClient的doExecute()方法内进入了执行链,执行链的尾端是MainClientExec,所以主要逻辑在它的execute()方法中。其大致过程如下:
1)参数判断,认证相关,特殊请求实体的加强(得到代理)等过程
2)设置userToken,这与连接池的state相关,它可以将某些链接与特定用户绑定,默认是null
3)调用connManager的requestConnection的方法,该方法返回了请求池的一个链接(JUC编程)。execAware变量标识的是request的本体对象,通过HttpRequestWrapper透明化中间程序对请求的更改,而当使用者更改请求时程序能通过execAware及时响应。
4) 通过future的get方法获取Http链接,该链接如果通过PoolingHttpClientConnectionManager获取,一般是LoggingManagedHttpClientConnection类型,这个链接会设置到上下文中,使用者可以获得
5)调用BHttpConnectionBase中的isStale()方法检查链接是否有效,此处不能保证一定有效
6)对连接的许多操作封装在ConnectionHolder中,所以创建一个handler,将log、connManager 和链接本身都传递进去然后执行此次请求。
7)执行过程:判断请求是否重复执行->链接的socket是否打开->认证相关->requestExecutor组装获取的所有资源和配置,执行请求返回response->根据返回的消息头设置该链接是否继续可用 ->判断链接是释放还是abort->返回响应的代理->异常处理。对request本体的状态判断穿插在上述过程中。
PoolingHttpClientConnectionManager的requestConnection(route, state)方法
创建了route作为key,RouteSpecificPool为value的HashMap,在获取链接时经历了如下过程:
1)根据route获取对应的RouteSpecificPool链接池,里面存储了该路由对应的链接的LinkedList列表,如果有空闲短链接,或者可用的永久长链接(轮询判断是否可用)则将该链接返回。此次获取需要匹配state值相同的链接。
2)由于该路由下没有可复用的链接,需要新建链接,首先判断连接数是否超量(单个路由的最大值maxPerRoute),超量则收回超出的资源,如果没有超量,判断当前可用链接的总数加上已用链接的总数是否超出总链接数(maxTotal),则去除最近的可用的其它池子的链接,给本次新建链接腾出位置。
3) 新建链接,并返回