淘宝爬虫 之 登陆验证(一)

淘宝作为一大电商网站,反爬措施还是相当的完善的

1-1

输入账号密码,先别着急点击登陆,需要准备一下;开发者模式找到网络,点击持续更新日志,否则是找不到登陆页面的

1-2

接下来点击登陆,会发现login,里面就是我们需要的cookie了

1-3

找到Form Data,里面的数据就是我们需要的,全部都要

1-4

分析到此结束,下面直接上代码

import requests

#淘宝登陆的url

url ="https://login.taobao.com/member/login.jhtml"

#记录登陆状态方便后续请求

ponse = requests.session()

headers = {

'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36',

}

data = {

#在这里放入1-4 中的数据

}

#测试cookie是否验证成功,可以换成淘宝其他的url

url1 ="https://s.taobao.com/search?q=%E9%94%AE%E7%9B%98&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.2017.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170306"

#记录登陆请求状态

ponse.post(url,headers=headers,data=data)

#后续请求

t = ponse.get(url1,headers=headers)

print(t.content.decode("utf8"))

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容