tornado-05请求分析request

WEB请求的那些事

在上节中，主要搭建了web服务，来响应客户端的请求。

这节中，我们来根据客户请求报文中的请求行(Request line) ,请求头部(Request Header),请求主体(Request body)的信息，来描述服务端如何处理。

请求行的格式：<method> <request-URL> <version>

tornado.web库

再次重申：tornado 用 web.RequestHandler 类，来处理客户请求。每一次客户发来请求，先由服务器应用APP根据路由映射，调用处理类，生成一个RequestHandler类对象。这个类对象负责处理客户请求的请求信息，并根据类的处理方法，生成返回的响应报文。

我们这里，根据客户的请求报文三个部分，来看看客户的请求报文提供的信息。

处理请求方法Method--Request Line

客户的请求方式在HTTP/1.1中，有八种之多。在生产环境中常用到的是get和post两种方法。

get方法，主要用来请求数据。client端将请求的信息以URL编码的信息明文传递给服务器。

post方法，主要用来传递数据给服务端。client端请求的信息以数据包形式传送给服务端。

post请求，常用来提交表单的私密数据。get请求，网页中文件加载等。
同一个Request-URL，可使用多个请求方法。表示将概念相关的处理方法绑定在同一个URL中。

比如用户信息，用get表示请求用户信息，用post表示修改用户的信息等。

再如：Request-URL 为 http://ip:/book/book_id ，即可利用get 方法通过 book_id 得到书籍的详细信息。也可利用post方法，提交书籍的信息，从而修改书籍有详细信息。

实现过程：（这里测试同一个URL绑定多个请求方法）

#以一个请求地址的两种 请求方法为例。
#在路由映射中添加：
# (r"/book/(\d+)", BookInfoHandler)

#添加处理类，注意这里的id来源。
class BookInfoHandler(tornado.web.RequestHandler):
    def get(self,id):
        self.write(id);
    
    def post(self,id):
        self.write(id + "post")
        
# 测试方法：在ubuntu中命令：
# 测试get: 
#curl http://192.168.128.140:8000/book/12345612
# 测试post:
#curl -d aaa=bbb http://192.168.128.140:8000/book/12345612

URL的秘密

URL书写风格
- URL有两种表示风格。早期，查询字符串风格，在URL中以？表示传递的参数，比如在百度中搜索hello,URL的请求地址：https://www.baidu.com/s?wd=hello&ie=UTF-8 。
  - 后期，出现RESTFUL风格的表示方式(Representational State Transfe). 这种概念中，每一个URL 都表示一种资源，而将对资源的操作放在了请求体中。简单说来，也是一种HTTP的分层思想，将资源和操作分离开。
查询字符串风格：http://192.168.128.140:8000/book?id=123456

RESTFUL风格： http://192.168.128.140:8000/book/id/123456

通过参数使用方法，通过路径调用方法

自定义参数 --URL和Request body

在客户端的请求报文中，网站开发者的自定义参数，出现在两个地方：URL的查询字符串中，和请求报文的请求体(Request body)中。
get_argument 获取URL查询字符串或请求体中的参数信息。而get_arguments 获取查询字符串或请求体中的信息对应元素列表。命令使用方法：get_argument(target_name,default,strip=true) ，注意返回的信息是unicode字符串。
get_query_argument ，get_query_arguments。只查询URL字符串信息。

get_body_argument, get_body_arguments 查询请求主体中信息。

# 常用get_argument 来获取参数。get_query_argument我在firefox测试才正常，而get_body_argument在curl下测试正常。所以建议使用get_argument.
# get_argument和get_arguments,都接受一个参数的多个值，但get_argument只返回这个参数的最后一个值，get_arguments 返回这个参数值的列表。参考tornado源码的说明 。
# 测试例子。添加路由：(r'/argument',ArgHandler) ,这里注意，如用上节的代码添加，需要先把根路由'/'删除或放在最下面，否则先匹配到根路由，就不再往下面匹配路由。
class ArgHandler(tornado.web.RequestHandler):
    def get(self):
        arg1 = self.get_argument('arg1', '')
        print arg1
        self.write(arg1)
        
# 这里再补充一个知识，便于服务器重启。
# 正常情况下，我们每次修改这个服务器程序，都要在服务器端重新运行启动命令：python server.py
# tornado为我们提供了一个服务器应用的参数，debug调试。开启会，如果代码有修改，它会重新加载，并且服务器出错，会在浏览器中返回错误信息。可在开发环境中使用，但不要在正式环境中使用。代码如此下：
app = tornado.web.Application(
    handlers,
    debug = True
)
#注意，handlers后，添加逗号。

URL路由匹配问题

第三节中，我们简单的说明了路由正则匹配的事情。这里我们需要注意几点：
- 链接路由请求，在路由匹配时，只要匹配到。就不再向后匹配。

如果使用正则分组，请求方法的参数要分组名保持个数相同。如果分组没命名，则按顺序传入参数。

服务中处理请求时，分组做为参数传递。对参数进行操作。(倒序)

# 以第一例来说：(r"/book/(\d+)", BookInfoHandler)，此处正则匹配时有一分组，分组将会以一个整体看待做为参数，传递给处理方法：BookInfoHandler。所以后面定义类的处理方法时有两个参数：get(self,id)。否则，web.RequestHandler类会报错。
# 分组命令写法：(r"/book/(?P<bid>\d+)",BookInfoHandler),此处将分组命名为：bid.那么后面处理方法：BookInfoHandler必须将bid 作为参数,而不能用名字做为参数。如：get(self,bid)

# 示例如下：
# match with，匹配路由：(r"/book/(?P<bid>\d+)",BookInfoHandler)
# 处理方法：倒着输出bid。
class BookInfoHandler(tornado.web.RequestHandler):
    def get(self,bid):
        self.write(bid[::-1])
        
# 运行服务器应用，在客户浏览器测试：http://192.168.128.140:8000/book/123456.
# 在浏览器会显示 ：654321

请求头部的元素--Request header

每一次客户请求报文中请求头部包含的客户端信息，我们都封装在这次请求生成的RequestHandler对象的request属性中。比如说请求头部包含的客户地址表示：self.request.remote_ip。

下面列出一些比较请求信息：

* self.request.method HTTP请求方法。如：get,post,put等。
* self.request.url 请求的完整URL。 path:路径部分。query: 查询部分。
* self.request.body 请求主体。
* self.request.remote_ip , 客户端的IP地址作为字符串。如果HTTPServer.xheaders设置，将传递由负载均衡器 
在X-Real-Ip或X-Forwarded-For头中提供的真实IP地址。
* self.request.cookie  客户存储的cookie值。
* self.request.files 文件属性中使用文件上传。
* self.request.connection 长连接。
* self.request.request_time 返回此请求执行所花费的时间。

tornado-05请求分析request

tornado-05请求分析request

WEB请求的那些事

tornado.web库

处理请求方法Method--Request Line

URL的秘密

自定义参数 --URL和Request body

请求头部的元素--Request header

相关阅读更多精彩内容

友情链接更多精彩内容