environ字典与WebOb包

一、environ字典值

environ 字典中包含了在 CGI 规范中定义了的 CGI 环境变量,WSGI变量和一些系统变量(如果需要的话)

environ字典 变量名
CGI变量 REQUEST_METHOD
CGI变量 SCRIPT_NAME
CGI变量 PATH_INFO
CGI变量 SERVER_NAME
CGI变量 SERVER_PORT
CGI变量 QUERY_STRING
CGI变量 CONTENT_TYPE
CGI变量 SERVER_PROTOCOL
WSGI变量 wsgi.version
WSGI变量 wsgi.input
WSGI变量 wsgi.errors
WSGI变量 wsgi.multithread
WSGI变量 wsgi.run_once

1.CGI环境变量

1.REQUEST_METHOD:HTTP 请求的类型,比如「GET」或者「POST」。这个不可能是空字符串,所以是必须给出的。

2.SCRIPT_NAME:URL 请求中路径的开始部分,对应应用程序对象,这样应用程序就知道它的虚拟位置。如果该应用程序对应服务器的根目录的话,它可能是空字符串。
3.PATH_INFO:URL 请求中路径的剩余部分,指定请求的目标在应用程序内部的虚拟位置。如果请求的目标是应用程序根目录并且没有末尾的斜杠的话,可能为空字符串。
SCRIPT_NAME是URL中CGI脚本在服务器(如apache,IIS等)根目录下的路径(物理路径),而PATH_INFO则是这个脚本中具体执行部分的位置(虚拟路径),SCRIPT_NAME和PATH_INFO不能同时为空字符串。

4.SERVER_NAME,SERVER_PORT:这些变量可以和 SCRIPT_NAME、PATH_INFO 一起组成完整的URL。然而要注意的是,重建请求 URL 的时候应该优先使用 HTTP_HOST 而非 SERVER_NAME 。SERVER_NAME 和 SERVER_PORT 永远不能为空字符串,也总是必须存在的。

5.QUERY_STRING:URL 请求中跟在 “ ? ” 后面的那部分,可能为空或不存在。通常为GET方法提交的变量。
6.CONTENT_TYPE:HTTP 请求中任何 Content-Type 域的内容,可能为空或不存在。
7.CONTENT_LENGTH:HTTP 请求中任何 Content-Length 域的内容,可能为空或不存在。
8.SERVER_PROTOCOL:客户端发送请求所使用协议的版本。通常是类似「HTTP/1.0」或「HTTP/1.1」的东西,可以被用来判断如何处理请求包头。(既然这个变量表示的是请求中使用的协议,而且和服务器响应时使用的协议无关,也许它应该被叫做REQUEST_PROTOCOL。不过为了保持和 CGI 的兼容性,我们还是使用这个名字。)

服务器或网关应尝试提供适用的其他CGI变量。 此外,如果正在使用SSL,则服务器或网关还应提供尽可能多的Apache SSL环境变量,例如HTTPS = on和SSL_PROTOCOL。 但请注意,使用除上面列出的CGI变量之外的任何CGI变量的应用程序必然不可移植到不支持相关扩展的Web服务器。 (例如,不发布文件的Web服务器将无法提供有意义的DOCUMENT_ROOT或者PATH_TRANSLATED。)
注意:不需要的变量(例如不用身份验证时的REMOTE_USER)不应该在environ词典中。CGI定义的变量必须是字符串,如果它们存在的话。 如果CGI变量的值是除str之外的任何类型,则违反此规范。

2.WSGI定义变量

除了CGI定义的变量之外,environ字典还可以包含任意操作系统“环境变量”,并且必须包含以下WSGI定义的变量:

1.wsgi.version:元组(1, 0),代表 WSGI 1.0 版
wsgi.url_scheme:字符串,表示应用请求的 URL 所属的协议,通常为「http」或「https」。
2.wsgi.input: 类文件对象的输入流,用于读取 HTTP 请求包体的内容。(服务端在应用端请求时开始读取,或者预读客户端请求包体内容缓存在内存或磁盘中,或者视情况而定采用任何其他技术提供此输入流。)
3.wsgi.errors: 类文件对象的输出流,用于写入错误信息,以集中规范地记录程序产生的或其他相关错误信息。这是一个文本流,即应用应该使用「n」来表示行尾,并假定其会被服务端正确地转换。(在 str 类型是 Unicode 编码的平台上,错误流应该正常接收并记录任意 Unicode 编码而不报错,并且允许自行替代在该平台编码中无法渲染的字符。)很多 Web 服务器中 wsgi.errors 是主要的错误日志,也有一些使用 sys.stderr 或其他形式的文件来记录。Web 服务器的自述文档中应该包含如何配置错误日志以及如何找到记录的位置。服务端可以在被要求的情况下,向不同的应用提供不同的错误日志。
4.wsgi.multithread:如果应用对象可能会被同一进程的另一个线程同步调用,此变量值为真,否则为假。
5.wsgi.multiprocess:如果同一个应用对象可能会被另一个进程同步调用,此变量值为真,否则为假。
6.wsgi.run_once:如果服务端期望(但是不保证能得到满足)应用对象在生命周期中只被调用一次,此变量值为真,否则为假。一般只有在基于类似 CGI 的网关服务器中此变量才会为真。

3.使用environ

environ就是一个字典,所以操作environ参数就是操作一个dict变量。

创建

字典由键和对应值成对组成。字典也被称作关联数组或哈希表。基本语法如下:
environ = {'REQUEST_METHOD': 'GET', 'PATH_INFO': '/', 'SERVER_NAME': 'localhost','SERVER_PORT': '8080',......}
注意:

  • 每个键与值用冒号隔开(:),每对用逗号,每对用逗号分割,整体放在花括号中({})。
  • 键必须独一无二,但值则不必。值可以取任何数据类型,但必须是不可变的,如字符串,数或元组。
  • 创建environ字典通常是Server需要完成的,且必须字典中每个键都要存在(值可以为空)。我们一般不需要创建。

访问

访问字典中某个键的值
environ['SERVER_NAME']
如果字典中不存在该键则会报错。

修改

向字典添加新内容的方法是增加新的键/值对,修改已有键/值:
修改SERVER_PORT键的值
environ['SERVER_PORT'] = 8080
增加一个验证的键
environ['AUTH'] = "x-auth"

删除

能删单一的元素也能清空字典,清空只需一项操作。显示删除一个字典用del命令:
删除键是'AUTH'的条目
del environ['AUTH']
清空词典所有条目
environ.clear()
删除environ字典
del environ

遍历

将遍历后的tuple(key,value)放到一个list中

urll = ['%s : %s' % (key,value) for key,value in sorted(environ.items())]
print '\n'.join(urll)

字典内置函数&方法

Python字典包含了以下内置函数:

cmp(dict1, dict2)  #比较两个字典元素。
len(dict)              #计算字典元素个数,即键的总数。
str(dict)              #输出字典可打印的字符串表示。
type(variable)     #返回输入的变量类型,如果变量是字典就返回字典类型。 

Python字典包含了以下内置方法:

dict.clear()    #删除字典内所有元素
dict.copy()    #返回一个字典的浅复制
dict.fromkeys()    #创建一个新字典,以序列seq中元素做字典的键,val为字典所有键对应的初始值
dict.get(key, default=None)    #返回指定键的值,如果值不在字典中返回default值
dict.has_key(key)    #如果键在字典dict里返回true,否则返回false
dict.items()    #以列表返回可遍历的(键, 值) 元组数组
dict.keys()    #以列表返回一个字典所有的键
dict.setdefault(key, default=None)    #和get()类似, 但如果键不已经存在于字典中,将会添加键并将值设为default
dict.update(dict2)    #把字典dict2的键/值对更新到dict里
dict.values()    #以列表返回字典中的所有值

字典键的特性

字典值可以没有限制地取任何python对象,既可以是标准的对象,也可以是用户定义的,但键不行。两个重要的点需要记住:

  1. 不允许同一个键赋值两次。创建时如果同一个键被赋值两次,后一个值会被记住。但可以有两个相同的键存在。
  2. 键必须不可变,所以可以用数,字符串或元组充当,而不能用列表。

更多关于environ字典的内容:https://www.python.org/dev/peps/pep-0333/#environ-variables

二、WebOb包

1.Request对象

webob.Request是WebOb中的一个重要对象。它会对WSGI Server接收到的http request进行封装。

构造一个Request

environ有许多必需的变量。 为了更容易测试和使用,Request类有一个构造函数,它将填充一个最小的environ,一个简单的例子:

from webob import Request
from pprint import pprint

req = Request.blank('/article?id=1')
pprint(req.environ)

我们可以直接使用的req.environ属性直接操作填充好的environ字典。

操作Request body

既然是request,那么必然有个body(request body可以为空),并且也有request的方法(如GET,POST,DELETE,PUT,INDEX),所以可以这样操作body和method:

>>>hasattr(req.body_file, 'read')
True
>>>req.body
b' '
>>>req.method = 'PUT'
>>>req.body = 'test'
>>>hasattr(req.body_file, 'read')
True
>>>req.body
'test'

操作Request headers

请求头(request headers)也是一个字典:

>>>req.headers['Content-Type'] = 'application/x-www-urlencoded'
>>>sorted(req.headers.items())
[('Content-Length', '4'), ('Content-Type', 'application/x-www-urlencoded'), ('Host', 'localhost:80')]
>>>req.environ['CONTENT_TYPE']
'application/x-www-urlencoded'

操作请求参数:

>>> req = Request.blank('/test?check=a&check=b&name=Bob')
>>> req.GET
GET([('check', 'a'), ('check', 'b'), ('name', 'Bob')])
>>> req.GET['check']
'b'
>>> req.GET.getall('check')
['a', 'b']
>>> list(req.GET.items())
[('check', 'a'), ('check', 'b'), ('name', 'Bob')]

下面这个是比较常见的查看参数的方法:

>>> req.params
NestedMultiDict([('check', 'a'), ('check', 'b'), ('name', 'Bob'), ('name', 'Joe'), ('email', 'joe@example.com')])
>>> req.params['name']
'Bob'
>>> req.params.getall('name')
['Bob', 'Joe']
>>> for name, value in req.params.items():
...     print('%s: %r' % (name, value))
check: 'a'
check: 'b'
name: 'Bob'
name: 'Joe'
email: 'joe@example.com'

把Request传递给WSGI应用

from webob import Request

req = Request.blank('/')

def wsgi_app(environ, start_response):
    start_response('200 OK', [('Content-type', 'text/plain')])
    return ['Hi!']

print req.call_application(wsgi_app)

输出:

[root@OS_DEV dev]# python webobtest.py
('200 OK', [('Content-type', 'text/plain')], ['Hi!'])

call_application和get_response方法都可以返回response的内容:

  • req.call_application(wsgi_app)返回的是一个tuple。
  • req.get_response(wsgi_app)返回一个Response类,操作方便,更常用。

2.Response对象

webob.Response包含了标准WSGI response的所有要素。其本身也可以看成是一个WSGI的application。你可以通过req.call_application(res)对其调用。

操作Response Header

以list的方式输出一个header,最简单的例子如下:

>>> from webob import Response
>>> res = Response()
>>> res.status = 200
>>> res.status
'200 OK'
>>> res.status_code
200
>>> res.headerlist
[('Content-Type', 'text/html; charset=UTF-8'), ('Content-Length', '0')]
>>> res.body
b''

除了res.headerlist,还可以以字典的方式操纵header。

>>> res.headers
ResponseHeaders([('Content-Type', 'text/html'), ('Content-Length', '4')])

还可以通过res.headers.add(key,value)增加键值对,通过res.headers.getall(key)获取所有键值对。

写入Response body:

res.body属性将请求的整个主体表示为一个str(不是unicode,但如果定义了charset,则可以将其设置为unicode)。 还有一个res.app_iter属性,它将body作为迭代器输出,app_iter是一个特殊的list。 WSGI应用程序返回这些app_iter迭代器而不是str,有时一次加载整个迭代器可能会有问题(例如,如果返回一个非常大的文件的内容时)。但通常迭代器通常很简单,就像包含整个主体的字符串的单项列表一样。
如果设置了body,那么也将设置Content-Length,并为创建res.app_iter。 如果设置res.app_iter,则会清除Content-Length而不会设置,所以如果通过res.app_iter修改body,记得需要同时修改Content-Length的值。

通常可以通过以下简单的方式为整个body赋值:
res.body = b'test'

我们还可以访问一个 file-like 对象,它将直接更新app_iter(如果需要,将app_iter转换为list),如果charset = None,则需要先设置charset才能通过file-like对象操作body:

>>> res = Response(content_type='text/plain', charset=None)
>>> f = res.body_file
>>> f.write('hey')  
Traceback (most recent call last):
    ...
TypeError: You can only write text to Response if charset has been set
>>> f.encoding
>>> res.charset = 'UTF-8'
>>> f.encoding
'UTF-8'
>>> f.write('test')
>>> res.app_iter
[b'', b'test']
>>> res.body
b'test'

获取WSGI APP返回的Response

可以通过前面说过的req的一个方法得到WSGI APP返回的res。
res = req.get_response(wsgi_app)
注意下这个例子,这个例子把普通的WSGI的应用通过Request和Response做了一个简单的包装,虽然没有太大的修改,但可以帮我们理解装饰器的原理:

def my_app(environ, start_response):
...       req = Request(environ)
...     res = Response()
...     res.content_type = 'text/plain'
...     parts = []
...     for name, value in sorted(req.environ.items()):
...         parts.append('%s: %r' % (name, value))
...     res.body = 'n'.join(parts)
...     return res(environ, start_response)
>>> req = Request.blank('/')
>>> res = req.get_response(my_app)
>>> print res
200 OK
......

3.Exceptions

其实就是对HTTP错误代码的一个封装。也可以看成是一个WSGI的应用。

>>> from webob.exc import *
>>> exc = HTTPTemporaryRedirect(location='foo')
>>> req = Request.blank('/path/to/something')
>>> print(str(req.get_response(exc)).strip())
307 Temporary Redirect
Location: http://localhost/path/to/foo
Content-Length: 126
Content-Type: text/plain; charset=UTF-8
\r
307 Temporary Redirect

The resource has been moved to http://localhost/path/to/foo; you should be redirected automatically.

4.WSGIfy decorator

结合上面的例子,既然WebOb可以让WSGI的请求变得更加简单、强大,那么能不能不用原始的那种WSGI的参数和返回格式,而全部用WebOb替代?可以的,通过WSGIfy decorator这个装饰器。
比如这个最简单的例子:

@wsgify
def myfunc(req):
    return webob.Response('hey there')

调用的时候有两个选择:
app_iter = myfunc(environ, start_response)
或:
resp = myfunc(req)
第一种选择就是最原始和标准的的WSGI格式,第二种选择则是WebOb封装过后的格式。说实话后者看上去更加符合逻辑(给你个请求,给我个响应)。需要注意的是返回的值必须和输入的参数对应。
如果myfanc直接返回一个Exception,那么就会的相当于直接调用Exception这个WebOb的WSGI Application,可以很容易的返回异常页面。
另外也可以对Request进行继承,修改其内容,对真正的Request做一些判断(就是一个Middleware),比如:

class MyRequest(webob.Request):
    @property
    def is_local(self):
        return self.remote_addr == '127.0.0.1'
@wsgify(RequestClass=MyRequest)
def myfunc(req):
    if req.is_local:
        return Response('hi!')
    else:
        raise webob.exc.HTTPForbidden

需要记住一点:被@wsgify修饰过后的那些func,其Return的是个对Response的调用,即一个Response对象。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,874评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,102评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,676评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,911评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,937评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,935评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,860评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,660评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,113评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,363评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,506评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,238评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,861评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,486评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,674评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,513评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,426评论 2 352

推荐阅读更多精彩内容

  • 谈论WEB编程的时候常说天天在写CGI,那么CGI是什么呢?可能很多时候并不会去深究这些基础概念,再比如除了CGI...
    __七把刀__阅读 2,196评论 2 11
  • 原文:https://legacy.python.org/dev/peps/pep-3333 PEP:3333标题...
    老周_o_o阅读 2,398评论 0 5
  • Refer to: www.threemeal.com/blog/12/ 中间件 中间件是一个钩子框架,它们可以介...
    兰山小亭阅读 16,483评论 9 165
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,649评论 18 139
  • [TOC]一直想做源码阅读这件事,总感觉难度太高时间太少,可望不可见。最近正好时间充裕,决定试试做一下,并记录一下...
    何柯君阅读 7,179评论 3 98