Python网络编程笔记(四):网络数据和网络错误

前文讲了网络之间传输协议TCP和UDP的连接和建立,以及如何域名解析找到双方主机。现在该讨论如何准备网络传输用的数据,以及可能遇到的错误。

字节和字符串

8个二进制位 (bit) 组成的字节 (Byte) 是IP网络上的通用传输单元。文本数据最重要的就是选择一种编码方式,将想要传输的字符转换成字节。

字节字符串,本质上是字符

Python中表示字节的方法:

  1. 第一种使用一个正好介于0-255的整数

  2. 第二种使用字节字符串. 可以使用 bytes() 将包含数字的列表转换成字节字符串。

     >>> 0b1100010
     98
     >>> 0b1100010 == 0o142 == 98 == 0x62
     True
    

字节字符串的打印: 使用ASCII码作为简写形式,如果找不到对应ASCII码,则显示使用十六进制格式 \xNN 来表示。实际上是字符,比如 b'\x00\x01bcd', 注意它开头的 b

字符串

字符编码标准:

  • ASCII (American Standard Code for Information InterChange, 美国标准信息转换码,128个)
  • Unicode (Uni code, 已经收录10几万字符了)

Python 3 内部把字符串看做是由 Unicode 字符组成,已经对我们隐藏了细节。要处理的只是文件中或者网络上的数据。

操作:

  • 编码 (Encoding): Unicode 字符 => 字节字符串
    • 单字节编码,一个字节一个字符,最多256个字符
    • 多字节编码,定长的 UTF-32,不定长的 UTF-8,BOM表示字节顺序 \xeff
  • 解码 (Decoding):字节字符串 => Unicode字符串

错误:

  • 已编码的字节字符串不符合提供的编码规则,因此解码失败 (UnicodeDecodeError): b'\x80'.decode()
  • 字符无法使用提供的编码方式编码,因此编码失败 (UnicodeEncodeError): 'dd'.encode('latin-1')

错误处理:使用正确编码,decode()/encode 加参数 ignore/repalce

字节顺序和二进制数

大端序和小端序

操作二进制用 struct 模块。

struct.pack('<i', 4253) // 小端
struct.pack('>i', 4253)  

struc.unpack('<i', b'\x00\x80')

封帧和引用

UDP是数据报,不存在粘包问题。

TCP传输流,就会遇到问题:接收方何时停止调用 recv()? 整个消息或数据何时完成传输完?何时能将接收到的信息作为一个整体去操作?

六个模式确保知道消息何时结束

模式一:只涉及数据发送,不关注响应。

发送方循环发送数据,直到所有数据都被传给 sendall(), 然后 close();
接收方一直调用 recv(), 直至 recv() 返回空。

模式二:一的变种,只不过两个方向上都发送

先通过流在一个方向发送,然后关闭该方向。接着在另一个方向发送。

模式三: 定长消息

双方约定好一个length。

模式四:使用特殊字符划分消息边界。

  • 定界符要选用传输字符之外的字符,比如传输ASCII字符,用空字符串 \0 定界。
  • 任意消息的话,可以使用转义,不过要处理事情太多,不建议。

模式五:每个消息前加上其长度作为前缀,流行选择。长度可以使用定长的二进制整数或者变长的整数字符串后加上一个文本定界符表示。

模式六:解决五中不知道消息长度的问题。将一条消息分为多个数据块发送,每个数据块前加上数据长度。信息结尾处,与发送方约定一个信号,比如长度为0的数据块。

块传输代码

#!/usr/bin/env python3
# Foundations of Python Network Programming, Third Edition
# https://github.com/brandon-rhodes/fopnp/blob/m/py3/chapter05/blocks.py
# Sending data over a stream but delimited as length-prefixed blocks.

import socket, struct
from argparse import ArgumentParser

// I 表示使用32位无符号整数,4B
header_struct = struct.Struct('!I')  # messages up to 2**32 - 1 in length

def recvall(sock, length):
    blocks = []
    while length:
        block = sock.recv(length)
        if not block:
            raise EOFError('socket closed with {} bytes left'
                           ' in this block'.format(length))
        length -= len(block)
        blocks.append(block)
    return b''.join(blocks)

def get_block(sock):
    data = recvall(sock, header_struct.size)
    (block_length,) = header_struct.unpack(data)
    return recvall(sock, block_length)

// 这里为什么不用 sendall? 如果知道数据多长,是否一次发送无所谓了。
def put_block(sock, message):
    block_length = len(message)
    sock.send(header_struct.pack(block_length))
    sock.send(message)

def server(address):
    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
    sock.bind(address)
    sock.listen(1)
    print('Run this script in another window with "-c" to connect')
    print('Listening at', sock.getsockname())
    sc, sockname = sock.accept()
    print('Accepted connection from', sockname)
    sc.shutdown(socket.SHUT_WR)
    while True:
        block = get_block(sc)
        if not block:
            break
        print('Block says:', repr(block))
    sc.close()
    sock.close()

def client(address):
    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    sock.connect(address)
    sock.shutdown(socket.SHUT_RD)
    put_block(sock, b'Beautiful is better than ugly.')
    put_block(sock, b'Explicit is better than implicit.')
    put_block(sock, b'Simple is better than complex.')
    put_block(sock, b'')
    sock.close()

if __name__ == '__main__':
    parser = ArgumentParser(description='Transmit & receive blocks over TCP')
    parser.add_argument('hostname', nargs='?', default='127.0.0.1',
                        help='IP address or hostname (default: %(default)s)')
    parser.add_argument('-c', action='store_true', help='run as the client')
    parser.add_argument('-p', type=int, metavar='port', default=1060,
                        help='TCP port number (default: %(default)s)')
    args = parser.parse_args()
    function = client if args.c else server
    function((args.hostname, args.p))

pickle 与自定义定界符的格式

有的数据本身已有定界符,不需要封帧。pickle 可以将数据结构保存起来,以便在另一台机器使用。

import pickle
    
pickle.dump()
pickle.loads()

pickle 使用 . 作为结束符,loads 时 .之后的内容不会读取,文件指针停留在此处,可以从此处用文件指针读。

数据格式

XML 与 JSON都很流行,文档的话 XML 更好,有结构。

二进制格式 Thrift, ProtoBuf

压缩

必要性:因为数据传输的时间远远多于 CPU 准备数据的时间

zlib.compress()
zlib.decompressobj()

zlib自己提供封帧,一般会在外面包一层封帧。

网络异常

针对套接字的异常:

  • OSERROR: 网络传输所有阶段都可能遇到。
  • socket.gaierror: getaddrinfo() 失败后返回, gai 是 get addr info 缩写。
  • socket.timeout: 设置了超时参数

抛出异常

有两种思路:

  • 完全不处理网络异常

  • 将网络错误包装我们自己的异常
    取决于我们的程序定位是还是工具

      class DestiError(Exception):
          def __str__(self):
              return '%s: %s' % (self.arg[0], self.__cause__.error)
    

捕捉和报告网络异常

两种方法:

  • granular 异常处理,对于每个网络调用都使用 try...except
  • blanket 异常处理: 在一个代码块或功能块使用 try...except,然后打印自己定义的错误。在顶层捕捉 FatalError
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,948评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,371评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,490评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,521评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,627评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,842评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,997评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,741评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,203评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,534评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,673评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,339评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,955评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,770评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,000评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,394评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,562评论 2 349

推荐阅读更多精彩内容