本人编程小白一枚,经过在各个论坛摸爬滚打地查了一天的攻略,终于成功在Python中安装selenium 这个package并加以应用。
1.安装环境
Window 7, Anaconda3(64-bit), Python 3.6
2. 安装selenium
安装过程中,这里遇到一个坑,多次尝试pip, conda, pip3 安装package都不成功,(看了好几篇帖子有提到用这几种方法,然而都没有安装成功)
报错如下
尝试一:
conda install selenium
Error 1:
Fetching package metadata ...
CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://repo.continuum.io/pk
gs/main/win-64/repodata.json.bz2>
Elapsed: -
An HTTP error occurred when trying to retrieve this URL.
HTTP errors are often intermittent, and a simple retry will get you on your way.
ProxyError(MaxRetryError("HTTPSConnectionPool(host='repo.continuum.io', port=443
): Max retries exceeded with url: /pkgs/main/win-64/repodata.json.bz2 (Caused by
ProxyError('Cannot connect to proxy.', OSError('Tunnel connection failed: 407 P
roxy Authentication Required',)))",),)
尝试二:
pip install selenium
Error2:
(C:\ProgramData\Anaconda3) d:\Users\niuyin\Documents>pip install selenium
Collecting selenium
Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
after connection broken by 'ProxyError('Cannot connect to proxy.', OSError('Tun
nel connection failed: 407 Proxy Authentication Required',))': /simple/selenium/
Retrying (Retry(total=3, connect=None, read=None, redirect=None, status=None))
after connection broken by 'ProxyError('Cannot connect to proxy.', OSError('Tun
nel connection failed: 407 Proxy Authentication Required',))': /simple/selenium/
Retrying (Retry(total=2, connect=None, read=None, redirect=None, status=None))
after connection broken by 'ProxyError('Cannot connect to proxy.', OSError('Tun
nel connection failed: 407 Proxy Authentication Required',))': /simple/selenium/
Retrying (Retry(total=1, connect=None, read=None, redirect=None, status=None))
after connection broken by 'ProxyError('Cannot connect to proxy.', OSError('Tun
nel connection failed: 407 Proxy Authentication Required',))': /simple/selenium/
Retrying (Retry(total=0, connect=None, read=None, redirect=None, status=None))
after connection broken by 'ProxyError('Cannot connect to proxy.', OSError('Tun
nel connection failed: 407 Proxy Authentication Required',))': /simple/selenium/
Could not find a version that satisfies the requirement selenium (from version
s: )
No matching distribution found for selenium
尝试三
pip3 install selenium
Error3:
同上。
最开始以为是网络proxy的问题,后来发现事情并没有那么简单。电脑重启后,又多次用pip 和conda重新install,仍然未成功安装。
后来将电脑静置数分钟再去安装居然成功了,莫名其妙,如果有大神知道原因请指导下。(正常联网用代理的情况下成功的)
(C:\ProgramData\Anaconda3) d:\Users\Username\Documents>pip install selenium
Collecting selenium
Using cached https://files.pythonhosted.org/packages/80/d6/4294f0b4bce4de0abf1
3e17190289f9d0613b0a44e5dd6a7f5ca98459853/selenium-3.141.0-py2.py3-none-any.whl
Requirement already satisfied: urllib3 in c:\programdata\anaconda3\lib\site-pack
ages (from selenium)
Installing collected packages: selenium
Successfully installed selenium-3.141.0
You are using pip version 9.0.1, however version 19.0.2 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' comm
and.
以上安装方法不是碰运气成功的,后来尝试过uninstall selenium,同样的方法仍旧能成功安装。前期报错10次左右后安装成功。
这里有个帖子描述了遇到的各种问题以及部分解决方案,请移步https://github.com/conda/conda/issues/6007
selenium 能支持Chrome, Firefox,IE 等浏览器,这里以Firefox为例。
3.Firefox 浏览器安装
这里没有坑,正常下载安装即可。
下载地址: https://www.mozilla.org/zh-CN/firefox/new/
4.WebDriver安装
下载对应浏览器的driver。Firefox对应的driver是Geckodriver。
下载地址: https://github.com/mozilla/geckodriver/releases
解压后将geckodriver.exe 放到指定位置即可。
关于driver的放置位置,这里需要注意,是个大坑。网上有很多种说法,总结下来可以归为以下三种:
说法一: 放在Python 安装的根目录下,和python.exe同一folder;
说法二:放在浏览器的安装目录下,和firefox.exe 在同一个folder。
说法三:放在浏览器的安装目录下,并将其复制一份到python.exe目录下。
经过本人不懈的努力测试下,发现这三种方法均可行。只要保证在配置环境的过程中在path添加的路径和该driver的路径一致即可。比如我将该Driver分别放在 C:\ProgramData\Anaconda3\Scripts 和 C:\Program Files\Mozilla Firefox 路径下,并在系统中配置好相应的路径,亲测可用。
5. Path 环境配置
技术小白看这些技术贴真的很费劲,每一个汉字都认识,放在一起就是不知道什么意思,也不知道如何操作。经过无数次是错,终于一顿操作猛如虎成功配置好环境。
什么叫配置环境
小白解读:就是把路径和目的地连接好,程序才可以按照路径一步一步的去执行动作。
在哪里配置环境
(添加path路径)
去‘computer’--> 右键--> properties-->左侧 Control Panel Home的Advanced system settings --> 打开system properties窗口,点击红框,环境变量,如下
打开Environment Variable窗口,点击上边User Variables 中的Path,如下图
编辑用户变量,在变量栏中加入‘;你的driver的路径’,我这里加入的是;C:\Program Files\Mozilla Firefox\ 具体如下图所示:
点击OK关闭窗口。
注意事项
1.环境变量分为 用户环境变量 和 系统环境变量两部分。这里是要在 用户变量环境 中的已存在的‘path’变量下把变量值再加入以上路径即可,不是重新建立path变量再更新变量值。
- 注意是user variable!不是下面的system variable。重要的事情说三遍。
- 如果不想/找不到 在system中配置环境的话,可以直接在Python code中将路径参数标明,这样同样能运行成功。
firefox_path = r'C:\Program Files\Mozilla Firefox\geckodriver.exe'
driver = webdriver.Firefox(executable_path=firefox_path)
用以上code也能达到相同结果。
6.Demo
安装好需要的package,browser 和driver后,迫不及待地想要尝试下是否能用。以下是一个小的demo,用selenium自动打开Firefox并至baidu主页。
import selenium
from selenium import webdriver
from selenium.webdriver.firefox.firefox_profile import FirefoxProfile
url = r'https://www.baidu.com/'
firefox_path = r'geckodriver.exe'
profile = FirefoxProfile()
driver = webdriver.Firefox(executable_path=firefox_path)
driver.get(url)
driver.quit()
看,成功了!撒花!