木鱼非鱼 - 简书

发简信

木鱼非鱼

2
关注
1
粉丝
1
文章
522

字数
1

收获喜欢
1

总资产

IP属地：湖南

木鱼非鱼

言射手
写了 998210 字，被 1296 人关注，获得了 3476 个喜欢

在不可阻止的，不可逆反的信息洪流里，我们不过是数据暂时的宿主，它们终将越过我们而去。
木鱼非鱼

Web前端之路
图南指北编，13767 篇文章，24269 人关注

爱前端，在路上，希望结伴而行。问题咨询请联系微信736858088

木鱼非鱼

其实还要注意一个问题，如微博这样的网站，他们的cookie是加密了的，直接使用cookie是不能成功的，需要用特定的编码格式进行加密。

python3的爬虫笔记7——验证码登录
(1)方法一手动输入验证码对于需要验证码登录的情况，采用先下载验证码图片，手动输入后，利用cookie保持在线，从而获取网页信息，这是一种比较简单的方法。这里以登录厦门大学...

X_xxieRiemann
11451 3 7
木鱼非鱼

我想问下，为什么cookie处理后建立opener后不用intall_opener方法，而代理处理器建立后需要用？

python3的爬虫笔记6——COOKIE登录
我们经常有这样的上网经历，就是如果你采用用户名密码登陆一个网站之后，如果在一段不长的时间内，再次访问这个本来需要你登陆的网站，你会很轻易地访问，而不需要再次输入用户名密码。这...

X_xxieRiemann
9384 1 7 1
木鱼非鱼

X_xxieRiemann
写了 51639 字，被 179 人关注，获得了 249 个喜欢
木鱼非鱼

这里真的不错，以前在官方也看到opener，也用过，但是会觉得半懂非懂的。话说requests真心人性化。

python3的爬虫笔记5——代理IP和时间设置、异常处理
对于反爬虫机制的处理，除了笔记2中伪造浏览器的方法，还可以使用代理IP和时间设置一、代理IP 适用情况：限制IP地址情况，也可解决由于“频繁点击”而需要输入验证码登陆的情况...

X_xxieRiemann
11116 2 6
木鱼非鱼

python3的爬虫笔记5——代理IP和时间设置、异常处理
对于反爬虫机制的处理，除了笔记2中伪造浏览器的方法，还可以使用代理IP和时间设置一、代理IP 适用情况：限制IP地址情况，也可解决由于“频繁点击”而需要输入验证码登陆的情况...

X_xxieRiemann
11116 2 6

木鱼非鱼

python3的爬虫笔记2——伪装浏览器
有些网站会检查你是不是真的浏览器访问，还是机器自动访问的。这种情况，加上User-Agent，表明你是浏览器访问即可。服务器会识别headers中的referer是不是它自己...

X_xxieRiemann
11284 1 3
木鱼非鱼

数据分析的实习？工资多少？怎么找？这里有你想知道的一切
注：1.本项目所有的代码均放在了我的GitHub上，戳我戳我进行访问。2. 感谢周同学的指点，补充了关于所属行业的分析以及调整了多项计数的方式。项目背景最近在考虑暑假去哪...

飘荡的鱼头头头头头大
11250 3 21 4
木鱼非鱼

scrapy笔记
scrapy源码https://github.com/scrapy/scrapy/tree/master/scrapy 第一章、scrapy的模块有spiders,sele...

4381 0 1
木鱼非鱼

爬虫专题
向右奔跑编，532 篇文章，2914 人关注

我们的目标是，爬爬爬爬完知乎爬简书爬完豆瓣爬京东爬完网站，爬移动端爬完数据，搞分析收录分享优质爬虫学习文章加微信 yong164647 （暗号 py）进入爬虫数据分析群交流学习
木鱼非鱼