1.准备:
1)Python开发环境, 笔者用的是3.7.3; 工具用的是Pycharm
2)参考:
email.message.Message(): https://docs.python.org/3/library/email.compat32-message.html#email.message.Message
email.message : https://docs.python.org/3/library/email.message.html#email.message.EmailMessage
博客: https://www.cnblogs.com/huchong/archive/2018/07/02/9253247.html
2.上路:
2.1 入口函数
2.2 read_email()方法
这边和其他博客主不一样的地方是
typ, msg = M.fetch(num, '(RFC822)') 返回的msg, 我这边msg[0][1]是bytes类型, 而不是str类型, 所以没有办法直接调用message_from_string()方法, 需要先把bytes转成str, 转化的时候出现了问题, 我一开始的代码是:
message = email.message_from_string(msg[0][1].decode(encoding='utf-8'))
运行的时候发现读取到部分邮件的时候会报错:
所以我新增了1行代码用来获取邮件内容的编码方式
coding = chardet.detect(msg[0][1])
就没有在报错了.
2.3 parse_msg() 方法
这个方法主要用来解析邮件内容的, 我这边只需要用到邮件标题和收件人就可以, 所以实现方法和其他博客会不一样.
中间用到了email.header.decode_header(str)对subject进行解码, 解码返回的结果是:
[(str, coding)]
str是解码之后可能是bytes或者str类型,如果是str,coding就是None;如果不是str而是bytes, 那么coding就是对这个str的编码方式,还需要进一步解码.
3.结果:
这里直接展示结果, 后续会对标题进一步筛选, 筛选出合适自己的内容.