登录注册写文章

selenium（一）

selenium（一）

简介

最初是作为自动化工具，网页测试工具。能够像正常浏览器一样执行js、ajax，可以轻易过加密、验证等反爬技术。在反爬越来越严格的今天，可以有效地爬取一些网站，比如京东。

程序启动

驱动下载：选取和自己的chrome、msedge、firefox版本对应的驱动。
python安装selenium库，pip install selenium就行。
然后可以自定义驱动和chrome文件路径，主要是方便一些绿软爱好者。

    Option=Options()
    Option.binary_location=r"D:\python\Chrome\Chrome-bin\chrome.exe"
    S =Service(r"D:\python\Chrome\chromedriver.exe")

参数设置

反爬当然不会放过selenium，所以需要设置一些参数

    Option.add_argument("--disable-blink-features=AutomationControlled")
    Option.add_experimental_option('excludeSwitches', ['enable-automation'])
    Option.add_experimental_option('useAutomationExtension', False)

据说这样可以掩饰一些特征
终极手段是这样：

os.system(r'start D:\python\Chrome\Chrome-bin\chrome.exe --remote-debugging-port=9222 --user-data-dir="D:\python\Chrome\Data"')
Option.add_experimental_option('debuggerAddress', '127.0.0.1:9222')

注意，这个和上面的excludeSwitches和useAutomationExtension冲突。

还有几个设置，比较实用

    Option.add_argument('--headless') 
    Option.add_argument('--no-sandbox')
    prefs = {"profile.managed_default_content_settings.images": 2,'permissions.default.stylesheet':2}
    Option.add_experimental_option('prefs',prefs)
    WD=webdriver.Chrome(service=S,options=Option)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

爬虫（七）使用Selenium爬取百度文库word文章
目录前言问题分析 Selenium简介 Selenium安装 Selenium基础知识 Xpath 动手实战 ...
CristianoC阅读 673评论 0赞 0
使用Python + Selenium打造浏览器爬虫
Selenium是一款强大的基于浏览器的开源自动化测试工具，最初由 Jason Huggins 于 2004 年在...
FifiZhuang阅读 7,856评论 5赞 71

Selenium 简介
[TOC] 简介 Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就...
Whyn阅读 1,226评论 0赞 2
自动化测试工具-selenium介绍及基本使用方法
Selenium是一个开源、免费、简单、灵活，对Web浏览器支持良好的自动化测试工具，在UI自动化、爬虫等场景下是...
高阳很捷迅阅读 500评论 0赞 0
(Python版) Scrapy+Django+Selenium 爬取Boss直聘职位信息
絮叨一下（本言论参考其他作者） boos直聘，想必对于找工作的同志都非常熟悉，为了快速获取boss上的发布职位信息...
琴伴一生阅读 3,667评论 0赞 4

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文