在浏览器进行爬取网页,模拟登陆的时候可能需selenium模拟浏览器的行为
在此我是用的是谷歌浏览器,python的编程环境
第一步
需要在python环境中安装selenium
pip install selenium
第二步
下载谷歌浏览器相应的软件,软件链接
下载相应版本的软件然后放到谷歌浏览器下的目录
C:\Program Files (x86)\Google\Chrome\Application
第三步
在其它教程里,需要添加第二步的软件到环境变量中,但是在测试中发现不好用,在此介绍另一种方法
在python编辑器中输入以下代码进行测试
from selenium import webdriver
chrome_driver = 'C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe'
browser = webdriver.Chrome(executable_path=chrome_driver)
browser.get('https://www.baidu.com/')
需要注意的是,只要指定第二步下载的软件的路径正确,如上例,
chrome_driver = 'C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe'
就可以正常运行