爬虫思路——Selenium豆瓣登录

需求:用selenium完成登录豆瓣账号


使用selenium前, 需要安装浏览器驱动

此处使用Chrome浏览器,安装浏览器驱动chromedriver

Chrome浏览器右上角  三个点竖立排列-->设置 -- > 关于Chrome -- >查找自己Chrome版本号

前往: http://chromedriver.storage.googleapis.com/index.html 下载对应或者接近版本的浏览器驱动

解压缩后,请放在Python根目录下,如下图:

登陆步骤一:切换到密码登陆

鼠标右键--> 检查,定位元素

位到了 li 标签,class属性名为 "acount-tab-account on"

同时发现这个标签是在父级标签 iframe 下,因此需要先切换到 iframe 下(此处iframe既没有 id 也没有 class属性,因此建议使用Xpath去寻找iframe),

找到 iframe 标签后,再切换到iframe操作,然后再去定位需要的元素

定位密码登陆按钮,并且点击


登陆步骤二:输入账号、密码

定位用户名、密码输入窗口并且传值

登陆步骤三:点击登陆按钮

定位登陆按钮,并点击 (登陆按钮属性值 class = 'btn btn-account'),可以尝试属性名空格后较长的 class = "btn-account"去定位按钮标签

完整代码如下:

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容