正确移除 selenium webdriver pyppeteer以及使用pypp碰到的问题解决

正确移除 selenium webdriver

driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
  "source": """
    Object.defineProperty(navigator, 'webdriver', {
      get: () => undefined
    })
  """
})

正确隐藏 pyppeteer

 await page.evaluateOnNewDocument('''() => {
        Object.defineProperty(navigator, 'webdriver', {
        get: () => undefined
        })
        }
    ''')

使用 pyppeteer 碰到的错误

  • pyppeteer.errors.ElementHandleError: Error: failed to find element matching selector ".btn_ok"

    我使用了下面的代码后出现的:为了实现检测元素是否存在,存在则程序结束,不存在则重试

    btn_ok = await page.Jeval('.btn_ok', 'node => node.style')

    mark

    解决办法:

    btn_ok = await page.querySelector('[class="nc_iconfont btn_ok"]')

    但是使用这个之后,当滑动失败之后,重现刷新滑动验证码之后,又会出现下面的错误。

    更新(2020-01-20):

    之前的理解错误了,这个根本原因是执行关闭浏览器 await browser.close() 的时候没有权限删除用户的浏览数据。

    解决办法:

    定义浏览器的时候设置参数 'userDataDir': r'D:\temporary',指定一个用户可以执行的目录,这样的话就可以了。

    但是这样的话,相当于保存了用户的浏览数据。

    可能又会碰到这么个错误,事件循环打开浏览器后,并没有执行,直接返回结果

    看了一下文档,调用 createIncogniteBrowserContext()直接打开一个无痕浏览器。这样就爽多了

    关闭的时候需要注意分开关闭,无痕关闭,正常打开的浏览器也需要关闭。

  • pyppeteer.errors.NetworkError: Protocol Error (Runtime.callFunctionOn): Session closed. Most likely the page has been closed.

mark

解决办法:这是由于库本身的问题。pyppeteer 库的问题。

mark

具体可参考 天猫淘宝知乎爬虫神器 -- Pyppeteer

也可以降低 websockets 的版本,改为 6.0 的版本

pip install websockets==6.0

这样问题就会少很多

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 参考:爬虫神器 Pyppeteer 介绍及爬取某商城实战Pyppeteer:比selenium更高效的爬虫界的新神...
    BeautifulSoulpy阅读 40,588评论 0 10
  • 如果大家对 Python 爬虫有所了解的话,想必你应该听说过 Selenium 这个库,这实际上是一个自动化测试工...
    g_ices阅读 4,143评论 0 1
  • 前言 前段时间因为有任务,需要四个电商(京东、淘宝、天猫、拼多多)的数据。而其中京东的没什么反爬,基本是随便抓。拼...
    生信师姐阅读 4,635评论 0 2
  • 如果大家对 Python 爬虫有所了解的话,想必你应该听说过 Selenium 这个库,这实际上是一个自动化测试工...
    HelloJames阅读 5,007评论 0 13
  • 一、前言 以前使用selenium的无头浏览器,自从phantomjs2016后慢慢不更新了之后,selenium...
    HHHHUA阅读 6,986评论 0 1