HTTP协议
对于HTTP之前我自己了解的不是很多,虽然我的专业是网工......现在了解也还不晚,这就整理了一些知识点和大家分享一下。
1.定义
HTTP协议(Hyper Text Transfer Protocol,超文本传输协议)的缩写,是用于从万维网(WWW)服务器传输超文本到本地浏览器的传送协议。
HTTP是一个基于TCP/IP通信协议来传递数据(HTML文件,图片文件,查询结果等)。
2.工作原理:
HTTP协议工作于客户端-服务器端。浏览器作为HTTP客户端通过URL向HTTP服务端(WEB服务器)发送所有请求。
WEB服务器根据接收到的请求后,向客户发送响应信息。
HTTP默认端口号为80,但是也可以改为8080或者其他端口。
其实说简单点,HTTP工作过程可分为四步:建立连接、发送请求信息、发送响应信息、断开连接
3.注意事项:
HTTP是无连接的:每次链接处理一个请求,服务器处理完请求并收到客户应答,断开连接,节省时间。
HTTP是媒体独立的:只要客户端和服务器知道如何处理数据内容,任何类型的数据都可以通过HTTP发送。
HTTP是无状态的:协议对于事务处理没有记忆。
4.HTTP消息结构
HTTP使用统一资源标识符(URI)来传输数据和建立连接;
客户端请求消息
客户端发送一个HTTP请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成
请求报文格式:
请求行 - 通用信息头 - 请求头 - 实体头 - 报文主体
下图给出了请求报文的一般格式。
服务器响应消息
应答报文格式:
状态行 - 通用信息头 - 响应头 - 实体头 - 报文主体
HTTP响应由四个部分组成:状态行、消息报头、空行和响应正文。
实例(菜鸟教程里面的实例)
下面实例是一点典型的使用GET来传递数据的实例:
客户端请求:
GET /hello.txt HTTP/1.1
User-Agent: curl/7.16.3 libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3
Host: www.example.com
Accept-Language: en, mi
服务端响应
HTTP/1.1 200 OK
Date: Mon, 27 Jul 2009 12:28:53 GMT
Server: Apache
Last-Modified: Wed, 22 Jul 2009 19:15:56 GMT
ETag: "34aa387-d-1568eb00"
Accept-Ranges: bytes
Content-Length: 51
Vary: Accept-Encoding
Content-Type: text/plain
输出结果
Hello World! My payload includes a trailing CRLF.
5.HTTP请求方法
根据HTTP标准,HTTP请求可以使用多种请求方法。
HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。
下面列个表具体说说:
6.响应头信息
HTTP响应头、请求头中与缓存控制的相关字段
1.Expires:过期时间。(HTTP 1.0的字段)
浏览器再次发起请求的时候会先检查是否超过这个时间,如果没超过则直接从缓存中读取信息。但是如果浏览器的时间和服务器的时间不一致,就会出现问题。
2.Cache-control:max-age=6000(毫秒)/no-cache/no-store/private/public (HTTP 1.1的字段)
同时设置Expires和max-age的情况下,使用max-age
3.Last-Modified:最后一次修改时间。
4.Etag:被请求变量的实体标记
响应头信息这个有点多,大家只需要了解就好,我在这就不写了,给大家分享一个链接来学习......
HTTP响应头信息详细介绍
7.HTTP状态码
HTTP状态码这一块比较重要,需要我们记住常用的状态码
HTTP状态码的英文为HTTP Status Code。
当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。
常见的状态码有以下几种:
- 200 - 请求成功
- 301- 资源(网页)等被永久地转移到其它URL
- 404- 请求的资源(网页)不存在
- 500- 内部服务器错误
HTTP状态码分类
HTTP状态码由三个十进制的数组成,第一个十进制数字定义了状态码的类 型,后两个数字没有分类的作用。
HTTP状态码共分为5种类型:
1** ——信息,服务器收到请求,需要请求者继续执行操作
2** ——成功,请求被成功接收并处理
3** ——重定向,需要进一步的操作以完成请求
4** ——客户端错误,请求包含语法错误或无法完成请求
5** ——服务器错误,服务器在处理请求的过程中发生了错误
下面给大家一个链接,有具体的状态码及其描述
HTTP状态码列表
8.HTTP content-type
Content-Type,表示内容类型,用于定义网络文件的类型和网页的编码,决定浏览器将以什么形式、什么编码读取这个文件
这就是为什么我们经常看到一些Asp网页点击的结果却是下载到的一个文件或一张图片的原因
其实对于HTTP content-type,我个人理解的不是很透彻......
9.版本历史
超文本传输协议已经演化出了很多版本,它们大部分都是向下兼容的。
客户端在发出请求的时候就会告诉它采用的协议版本号,这样在响应中后者就会采用相同的版本号协议响应请求。
0.9版本,已经过时。它只支持GET一种请求方式,客户端无法向服务器传更多的信息。
1.0版本,这是第一个在通讯中指定版本号的HTTP 协议版本,至今仍被广泛采用,特别是在 代理服务器中。
1.1版本,当前版本。持久连接被默认采用,并能很好地配合代理服务器工作。还支持以管道方式同时发送多个请求,以便降低线路负载,提高传输速度。
HTTP/1.1相较于 HTTP/1.0 协议的区别主要体现在:
1 缓存处理
2 带宽优化及网络连接的使用
3 错误通知的管理
4 消息在网络中的发送
5 互联网地址的维护
6 安全性及完整性
下次分享HTTP和HTTPS的区别,期待吧,期待就对了......