python学习—week15

week14总结:

围绕selenium学了不少东西,起初的想法很简单:通过selenium做一个自动化的脚本,能看看文章和视频就可以,但实际操作起来发现没那么简单……

首先是登陆问题,通过保存加载cookies的方法行不通,因为目标网站的cookies有效时间很短,因此每次只能通过扫二维码登陆,但是如何获取二维码有花了不少时间:

     一是二维码存在另一个Frame里,需要切换过去才行,即:

    知道了以后很简单,但是当时怎么也想不明白;

    二是二维码指向的不是一个图片地址,而是一段以‘data:image/png;base64,’开头的代码,查了查才知道,这是一种base64的编码,用起来很方便,通过python自带的base64库可解码:

    解码后即常规的二进制内容。

至此获取到了二维码,通过扫码登陆后自动获取cookies。

其实有更优的解法,不过还是这么做了权当是熟悉selenium操作。

成功登陆后,开始浏览文章,发现每篇文章的url很难定位,不如直接通过selenium的click()点击功能打开新页面:

关键是要切换句柄,否则无法实现对页面的操作。


week15任务:

1.开始觉着整个脚本实现起来并不复杂,但实际实现起来发现有很多坑,走了很多弯路,所以这一周还是进一步完善吧,把看视频的功能完善起来。

2.数据处理numpy+matplotlib

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 现状 好久好久没有更新博客了,应该有一个月了吧,这段时间内,好忙,公司的业务在上涨期,但是却把下面的一个小朋友砍掉...
    jb2阅读 5,104评论 0 2
  • 目录 1.解释self = [super init]方法 容错处理,当父类初始化失败,会返回一个nil,表示初始化...
    勇敢的_心_阅读 5,245评论 0 4
  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 13,830评论 1 32
  • 基于 SELENIUM 的自动化测试架构 非常感谢各位查阅本篇文章,笔者在此感谢各位。 目前市面上有分门别类的自动...
    厲铆兄阅读 11,282评论 6 43
  • 原文地址 https://mbinary.coding.me/introduction-to-bitcoin.ht...
    mbinary阅读 10,876评论 0 4