网络爬虫(1):python3使用Cookie-解决每天理财网站登陆签到获取积分的问题

前言:

最近菠萝妹的理财的小姐妹团里面理财话题好火呀,针对一个理财app,每天都靠小姐妹自觉在群里喊签到来获取签到赠送的积分。如果一天没有坚持,后续的当日积分就只有1分,连续每天签到的话就会有8分,而这个积分可以累积账号等级升级,账号级别高的可以减少服务费。因为自己比较懒,看消息有时候不及时,恰好在学Python,就尝试写了个签到的脚本。

分析:

首先签到需要登录才可以实现。

我们理财产品的URL: https://sso.my089.com/sso/login

由于我们模拟的是用户名登录,光从UI界面上我们可以看到,有用户名,密码,记住30分钟的按钮, 登录按钮。


站点登录模块

按F12可以看到,其实还有些隐藏的参数,比如 encryption


登录页面F12

思考1:

  1. Q1:我们要模拟登录操作,首先要看这个post操作带了哪些参数传递给服务器?
    A1:我们打开抓包工具 Fiddler,然后打开chrome,打开上面的URL。输入用户名和密码,点击登录按钮。
    这个时候我们可以看到Fiddler里面抓到了很多的记录。
  2. Q2: 但表示我们都需要模拟吗?
    A2: 显然不是,我们应该都知道,先找登录提交参数的地方。
    可以通过URL 这一览,看到有个/sso/login 的HTTPS协议的post请求,点开,看右边的sheet。
    request URL:/sso/login
    HTTP/1.1
    POST
    ...
    这些信息是我们编程的时候都需要用到的。
Fiddler抓包页面
client
cookie
登录form

从上面的表单我们还可以看到,password 这个value是空的,但encryption 这个是经过MD5加密的,我们自己的密码传入这个加密的字符串.

码代码

用的python版本是Python3.5
创建了一个signin.py的文件
导入头文件:

  from urllib import request
  from urllib import error
  from urllib import parse

登录:

if __name__ =='__main__':
# 登录
login_url='https://sso.my089.com/sso/login'
# User-Agent 信息
user_agent=r'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36'
# Headers信息
head={'User-Agnet': user_agent, 'Connection': 'keep-alive'}
# 登录form的信息
Login_Data={}
Login_Data['username']='xxxxxxx'
Login_Data['phone']=''
Login_Data['encryption']='xxxxxxxxxxxxxx' #密码,MD5加密后的密码,用抓包工具查看,或者通过MD5在线加密工具把明文密码加密
Login_Data['password']=''
Login_Data['session_kept']='30'
Login_Data['loginCategory']='0'
Login_Data['back_url']='http%253A%252F%252Fbbs.my089.com%252F'
Login_Data['app_key']='xxxxxxxxx' #不同的用户不一样key
Login_Data['ltcc']='xxxxxxxxx' #不同的用户不一样

这块代码就是我们上面Fiddler 里面抓到的信息, 有登录的请求,有user-Agent, 有header信息,有登录的form

思考2:

  1. Q1:为啥要加heard信息?
    A1:因为我们是模拟浏览器,进行登录

  2. Q2:但为啥登录还是不能成功呢?
    A2: 我们还需要加Cookie

我们创建一个带Cookie的opener,在我们访问登录的url的时候,会将登录后的cookie保存到本地,然后我们就可以利用这个cookie来访问。

我们新手宝宝先官网查下cookie怎么使用

官方网址

官网

上面挑选一个查看具体的代码示例,看看怎么使用:


示例代码

我们可以看到需要自己创建一个opener. 在http包中,提供了cookiejar。

接下来就是依葫芦画瓢,我们把先导入

    from http import cookiejar

然后把cookie保存到一个变量里面:

 #声明一个CookieJar对象实例来保存cookie
cookie=cookiejar.CookieJar()
# 利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler
handler=request.HTTPCookieProcessor(cookie)
# 通过CookieHandler创建oepener
opener = request.build_opener(handler)

接下来就是把登录这个请求post出去
python的代码里很简洁 。

  # 创建 登录的 request对象
  request_login =request.Request(url=login_url,data=loginpostdata,headers=head)
  ...
  response_login =opener.open(request_login)
  ...

同理,我们要实现签到功能。
我们通过Fiddler 工具看到签到也就是一样的一个post请求。比登录更简单。省略不写了。

调试

这里提下,怎么验证自己的post是正确的呢,我们加点调试代码,看返回的情况:

  try:
      response_login =opener.open(request_login)
     response_sign=opener.open(request_sign)
      print(response_login.read().decode('utf-8'))
      print(response_sign.read().decode('utf-8'))
except error.URLError as e:
      if hasattr(e,'code'):
         print('HTTPError:%d' % e.code)
    elif hasattr(e,'reason'):
        print('URLError:%d' % e.reason)

调试情况:


调试代码

到这里代码部分就全部完成啦~后面,可以做成个定时任务,定时调度。

题外话:过程中遇到Fidder 工具抓https 请求都是Tunnel to......443
解决方法:


tools->https
actions->reset All Cerfificates

后面发现,更好的方案是使用requests。
下面用requests写个登录模块:

 Login_Data = requests.post('https://sso.my089.com/sso/login', params={
    'username': 'xxxxxx',
    'phone': '',
    'encryption': 'xxxxxxxxxxxx',
    'password': '',
    'session_kept': '30',
    'loginCategory': '0',
    'back_url': 'http%253A%252F%252Fbbs.my089.com%252F',
    'app_key': 'xxxxxxxxxxxx',
    'ltcc': 'xxxxxxxxxxxx'})

Login_Data.encoding='utf-8'
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,580评论 18 139
  • 前言fiddler是一个很好的抓包工具,默认是抓http请求的,对于pc上的https请求,会提示网页不安全,这时...
    胖子爱猪蹄阅读 12,243评论 4 22
  • 本文分两部分 1.转他人的文章,详细介绍了跨站单点登录的原理和解决方案 2.我自己写代码,着重介绍里面的重点部分 ...
    dragonwarrior阅读 10,859评论 0 6
  • 这篇文章介绍了Mobile BI(移动商务智能)使用过程中涉及的各种身份认证的方式,主要目的是对这些方式的原理进行...
    雨_树阅读 1,999评论 1 2
  • 一年前陪你聊天的人还在么?三年前陪你聊天的人还在么? 月光打在她的身上,一如一年前,一如三年前...变了她的年华,...
    夕夏凉阅读 170评论 0 1