设置浏览器参数
为了避免每次运行程序都打开一个窗口,我们也可以设置无窗口访问,只需添加浏览器参数即可:
from selenium import webdriver
导入Options类
from selenium.webdriver.chrome.options import Options
url = 'https://www.baidu.com/'
Options类实例化
chrome_options = Options()
设置浏览器参数
--headless是不显示浏览器启动及执行过程
chrome_options.add_argument('--headless')
启动时设置默认语言为中文 UTF-8
设置lang和User-Agent信息,防止反爬虫检测
chrome_options.add_argument('lang=zh_CN.utf-8')
user-agent用来模拟移动设备
UserAgent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'
chrome_options.add_argument('User-Agent=' + UserAgent)
启动浏览器并设置chrome_options参数
driver = webdriver.Chrome(chrome_options=chrome_options)
浏览器窗口最大化
driver.maximize_window()
浏览器窗口最小化
driver.minimize_window()
driver.get(url)
获取网页的标题内容
print(driver.title)
page_source用于获取网页的Html代码
print(driver.page_source)
常用参数
启动就最大化--start-maximized
指定用户文件夹 User Data 路径,可以把书签这样的用户数据保存在系统分区以外的分区–-user-data-dir=”[PATH]”
指定缓存Cache路径–-disk-cache-dir=“[PATH]” 指定Cache大小,单位Byte–-disk-cache-size=100
隐身模式启动–-incognito
禁用Javascript–-disable-javascript# 禁止加载所有插件,可以增加速度--disable-plugins
禁用JavaScript--disable-javascript
禁用弹出拦截--disable-popup-blocking
禁用插件--disable-plugins
禁用图像--disable-images
设置代理chrome_options.add_argument('--proxy-server=http://{ip}:{port}') #http://127.1.1.10:8080