登录注册写文章

微信爬虫实践

蜡笔小姜和畅畅

微信爬虫实践

Screen Shot 2018-07-11 at 9.24.24 AM.png

概要

使用requests和BeautifulSoup来进行微信爬虫，实现登录和收发消息的功能。并且会介绍微信的具体业务流程和flask框架。

具体内容

flask
- session
  赋值
  ticket_dic = session('ticket_dic')
  获取值
  ticket_dic = session.get('ticket_dic')
- jsonify
  flask接口返回json格式的数据
  return jsonify(response)
- request
  定义一个请求方法
  def login(): if request.method == 'GET': 请求的内容
- render_template
  渲染一个html页面，也可以传入数据
  return render_template('login.html',qr_img=qr_img)
登录流程
- 获取二维码图片
- 扫描二维码，拿到用户头像
- 确认登录，获取用户信息，可以接受消息
- 获取好友列表
- 发送消息
  sender(id) -> receiver(id)
其他注意事项
- 用户凭证ticket
  xml解析
  def xml_parser(text): dic = {} soup = BeautifulSoup(text,'html.parser') div = soup.find(name='error') for item in div.find_all(recursive=False): dic[item.name] = item.text return dic
- cookie
  session['ticket_cookie'] = ticket_ret.cookies.get_dict()
- 正则(re)
  获取http链接
  redict_uri = 'redirect_uri="https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxnewloginpage?ticket=ARG5rXcGrb1FB-YaT3qeviuc@qrticket_0&uuid=QYKZ2sJyhw==&lang=zh_CN&scan=1530675611"'
  使用正则去掉‘redict_uri =’
  redirect_url = re.findall('redirect_uri="(.*)"',redict_uri)[0]
- 防盗链
  请求头hearder加入‘defer’字段
- 消息发送编码问题
  请求使用json=
  r = requests.post( url=msg_url, json=msg_data )

相关文档

项目地址

wechat

最后编辑于：2018.07.11 16:54:39

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

利用搜狗微信入口制作一个微信文章爬虫api
微信公众号现已成为主流的一对多媒体行为活动，也是现在互联网内容生产不可忽视的一股力量。在此基础上，微信公众号爬虫...
icetong_k阅读 13,145评论 1赞 7
Python爬虫实战(三) — 微信文章爬虫
前言最近烦心事挺多的，能让我得到快乐的是一行行能够运行的代码，那么今天为大家带来微信文章爬取实战。本篇目标根...
Epiphron阅读 9,979评论 1赞 51

家庭疗愈师第二天
5点起来洗漱就出去了，走出小区就看见天边万丈光芒的，太阳没生气来，但你知道它就在那下方，它的光芒照的天，金光一篇，...
袋鼠企鹅阅读 1,490评论 0赞 0
懂互联网的人都知道的秘密免费分享给你观点
从去年二月份开始坚持写文章，到现在也积累了100余篇同时在很多科技媒体都有了专栏，渐渐的开始在互联网的娱乐圈里小有...
星佳是个小人物阅读 3,369评论 0赞 1
最近读书感想
若想获得成长的连续性，学习必然是不可缺少的。学习的方式有许多种，可以读书，也可以在工作，生活中总结经验，从失...
Nancypower阅读 1,657评论 2赞 2

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文