HttpClient 4.5.2-(一)入门

最近深度学习了下HttpClient 4.5.2,大家都知道,HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议

理解不是太深刻,理解错误之处还请指出。废话不多说,开始记录。


使用工具
  • HttpClient 4.5.2
  • maven地址
    <dependency> <groupId>org.apache.httpcomponents</groupId> <artifactId>httpclient</artifactId> <version>4.5.2</version> </dependency>
public static void main(String[] args) {
    // 获取连接客户端工具
    CloseableHttpClient httpClient = HttpClients.createDefault();
    // 创建GET请求对象
    HttpGet httpGet = new HttpGet("https://www.baidu.com");
    
    String entityStr = null;
    CloseableHttpResponse response = null;

    try {
            
        // 执行请求
        response = httpClient.execute(httpGet);
        // 获得响应的实体对象
        HttpEntity entity = response.getEntity();
      // 使用Apache提供的工具类进行转换成字符串
        entityStr = EntityUtils.toString(entity);
        
    } catch (ClientProtocolException e) {
        System.err.println("Http协议出现问题");
        e.printStackTrace();
    } catch (ParseException e) {
        System.err.println("解析错误");
        e.printStackTrace();
    } catch (IOException e) {
        System.err.println("IO异常");
        e.printStackTrace();
    } finally {
        if (null != response) {
            try {
                // 释放连接
                response.close();
                httpClient.close();
            } catch (IOException e) {
                System.err.println("释放连接出错");
                e.printStackTrace();
            }
        }
    }
    
    // 打印响应内容
    System.out.println(entityStr);
}

我们平常使用浏览器进行访问网站时,httpClient 就相当于浏览器的一个标签页httpGet 就相当于浏览器上面的每一个超连接。我们需要建立在已经存在标签页的基础上,才能发起一个新的请求。EntityUtils就相当于浏览器的渲染引擎,把服务端响应回来的数据解析出来,当然,这里解析出来的是字符串,而浏览器解析出来的结果是已经渲染好的界面。httpClient的每一次访问都需要开启一个Http连接,而每一个Http连接都是很珍贵的,随意这地方后边会使用连接池进行管理。

  • 打印结果:

乱码结果
乱码结果

  上图所示,出现响应结果,但是细心可以发现,有一部分是 乱码显示,这部分为中文乱码

解决办法是把上面代码中的entityStr = EntityUtils.toString(entity);修改成entityStr = EntityUtils.toString(entity, "UTF-8");指定编码格式解析响应数据即可解决;

  • 打印结果:
正确结果
正确结果
  • 关于消耗HTTP实体内容

HttpClient推荐使用HttpEntity的getConent()方法或者HttpEntity的writeTo(OutputStream)方法来消耗掉Http实体内容。HttpClient也提供了EntityUtils这个类,这个类提供一些静态方法可以更容易地读取Http实体的内容和信息。和以java.io.InputStream流读取内容的方式相比,EntityUtils提供的方法可以以字符串或者字节数组的形式读取Http实体。但是,强烈不推荐使用EntityUtils这个类,除非目标服务器发出的响应是可信任的,并且http响应实体的长度不会过大

有些情况下,我们希望可以重复读取Http实体的内容。这就需要把Http实体内容缓存在内存或者磁盘上。最简单的方法就是把Http Entity转化成BufferedHttpEntity,这样就把原Http实体的内容缓冲到了内存中。后面我们就可以重复读取BufferedHttpEntity中的内容。

CloseableHttpResponse response = <...>
HttpEntity entity = response.getEntity();
if (entity != null) {
    entity = new BufferedHttpEntity(entity);
}
借鉴:HttpClient 4.3教程

入门结束,下一节记录【为GET和POST请求添加请求参数请求头

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • API定义规范 本规范设计基于如下使用场景: 请求频率不是非常高:如果产品的使用周期内请求频率非常高,建议使用双通...
    有涯逐无涯阅读 7,748评论 0 6
  • 一、概念(载录于:http://www.cnblogs.com/EricaMIN1987_IT/p/3837436...
    yuantao123434阅读 12,691评论 6 152
  • JSON JSON和XML都是需要解析的 JSON是一种轻量级的数据格式,一般用于数据交互服务器返回给客户端的数据...
    JonesCxy阅读 5,870评论 2 10
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,463评论 19 139
  • 一直对日本作家不感冒,历史原因吧,你懂得。对村上春树的了解更是少之又少。 因此读完了他的著作《当我谈跑...
    嘛事1阅读 3,502评论 3 12