大厂爬虫工程师教你,如何用Python模拟登陆微博,太长见识了

这里模拟登陆会用到selenium这个自动化测试的工具,先介绍一下这个工具。

selenium

selenium是一个web的自动化测试工具,最初是为网站自动化测试而开发的,selenium可以直接运行在浏览器上,它支持所有主流的浏览器,可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏

selenium的简单实用

首先selenium需要进行安装,安装比较简单。直接通过pip install selenium就可以了。
selenium安装完成之后还需要下载对应的驱动,这里需要一定要下载与浏览器对应的驱动,比如我的谷歌浏览器的版本是73.0.3683.103,那么就要下载对应版本的selenium的驱动,这里给大家两个网站。

selenium下载地址

http://chromedriver.storage.googleapis.com/index.html

Selenium对浏览器支持的版本

http://www.cnblogs.com/iceb/p/7195876.html
接下来以百度为例讲解selenium的简单使用

from selenium import webdriver
import time
wd = webdriver.Chrome()  
# 设置窗口大小
# wd.set_window_size(1280,800)
# 全屏
wd.maximize_window()
# 输入网址
wd.get('http://www.baidu.com')
# 截图
wd.save_screenshot("baidu.png")
# 找到输入框
kw = wd.find_element_by_id('kw')
# 在输入框中输入酒店
kw.send_keys("酒店")
# 点击百度一下
wd.find_element_by_id('su').click()
time.sleep(3)
wd.quit()

上面的案例中,如果没有把selenium添加到系统环境变量中程序会报错。这里可以指定路径来使用executable_path='./driver/chromedriver.exe'

模拟登陆微博PC端

driver = webdriver.Chrome()
# 隐式等待
driver.implicitly_wait(10)

driver.set_window_size(1200,1000)

driver.get('https://weibo.com/')
# 填写账号
driver.find_element_by_id('loginname').send_keys('账号')
# 通过xpath找到密码的输入框
driver.find_element_by_xpath("//div[@class='info_list password']/div/input").send_keys(pwd)
# 通过xpath找到登陆按钮进行点击
driver.find_element_by_xpath("//div[@class='info_list login_btn']/a").click()

这里账号密码可以写在配置文件中

加载配置文件

from configparser import ConfigParser
target = ConfigParser()
target.read('test.ini',encoding='utf-8')
pwd = target.get('weibo','password')

test.ini文件
[weibo]
password = '密码'

模拟登陆微博移动端

这里用PC端模拟移动端,可以用谷歌浏览器来模拟,F12打开控制台管理工具

image

接下来大家可以发现,移动端要比PC端简单的多,因为所有的标签都有ID。代码如下:

driver.get('https://passport.weibo.cn/signin/login')
driver.find_element_by_id('loginName').send_keys('账号')
driver.find_element_by_id('loginPassword').send_keys(pwd)
driver.find_element_by_id('loginAction').click()
driver.find_element_by_id("getCode").click()

(写在最后,以后每天晚上九点半之后会更新Python基础的技术连载,记得来看哦!)

此文来源于微博和今日头条:逻二妞,转载请注明出处,谢谢

推荐阅读

改变世界到语言—python,看完才知道从事python凭什么高薪!(2019年最新三大方向资源)

这本书教你读懂大脑中的神经元,并一个月内掌握Python基础,经典

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 现状 好久好久没有更新博客了,应该有一个月了吧,这段时间内,好忙,公司的业务在上涨期,但是却把下面的一个小朋友砍掉...
    jb2阅读 5,157评论 0 2
  • 这里模拟登陆会用到selenium这个自动化测试的工具,先介绍一下这个工具。 selenium selenium是...
    ju7ran阅读 3,552评论 0 4
  • Selenium 官网Selenium WebDriver官网webdriver实用指南python版本 WebD...
    顾顾314阅读 47,243评论 0 34
  • 上网原理 1、爬虫概念 爬虫是什麽? 蜘蛛,蛆,代码中,就是写了一段代码,代码的功能从互联网中提取数据 互联网: ...
    riverstation阅读 12,677评论 1 2
  • I love you once .I love you twice.I love you more than be...
    知更鸟Robin阅读 1,049评论 0 0

友情链接更多精彩内容