一、业务需求
谈到python对bytes类型数据的处理,常用的struct模块,网上资料甚多,这里不做赘述
用struct处理的前提是:接收方和发送方提前定义好不同变量的类型、长度、位置,然后双方安装柜子进行打包和拆包
这里有一个业务场景:双方指定单次业务长度是128
,发送方因为操作实物,一次性发过来n个数据包
接收方接受到的长度就是n*128
,如果还是安装之前指定的规则进行struck.unpack
就会出错
现在需要对数据包进行拆分,而且是根据长度来进行拆分
二、按照长度拆分字节流bytes:正则表达式
安装长度拆分字符串,正则是最快的
import re
data = "hello world"
ret = re.findall(r".{2}", data)
print("ret:", ret)
就可以得到想要的结果
ret: ['he', 'll', 'o ', 'wo', 'rl']
如果data是字节流bytes的话,直接使用会报错
TypeError: can't use a string pattern on a bytes-like object
需要做一些小小的改造
import re
data = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
ret = re.findall(b".{2}", data) #就是这里需要做小小的改造,看仔细哦
print("ret:", ret)
后续补充:
上面的正则表达式,通过 .
来匹配任意字符是不完善的:无法匹配回车符\n
以上代码需要改造
import re
data = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
ret = re.findall(b"[\s\S]{2}", data) #就是这里需要做小小的改造,看仔细哦
print("ret:", ret)
三、按照长度拆分字节流bytes:字符串切片
后面找到一个字符串切片的方式也不错
obj = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
sec = 2
[obj[i:i+sec] for i in range(0,len(obj),sec)]
返回的结果也很理想
[b'\xfe\xff', b'\xff\xff', b'\x00\x00', b'\x00\x00']
参考资料:
细究Python struct 模块
python 按照固定长度分割字符串的方法小结
如何对python的bytes类型数据split分割切片
python按照固定长度分割字符串
python - 正则表达式判断 - 正则表达式匹配单词
Python一行代码实现按指定长度分段切割字符串或列表
正则表达式匹配任意字符(包括换行符)的写法