卜地锦 - 简书

发简信

卜地锦

15
关注
1
粉丝
4
文章
1977

字数
1

收获喜欢
1

总资产

IP属地：吉林

卜地锦

《利用Python进行数据分析学习笔记》学习笔记（三）
1.工具和环境语言： python3.6系统：win7 64位数据库：MongoDBIDE：IPython notebook 2.数据加载、存储与文件格式pandas 提供了...

2444 0 0
卜地锦

《利用Python进行数据分析学习笔记》学习笔记（二）
1.工具和环境语言： python3.6 系统：win7 64位数据库：MongoDB IDE：IPython notebook 2.用pandas进行计数这里用的数据...

1729 0 0

卜地锦

《利用Python进行数据分析学习笔记》学习笔记（一）
1.工具和环境语言： python3.6 系统：win7 64位浏览器：chrome 2.安装和设置 pip pip是一个Python包管理工具，主要是用于安装或者卸载模...

2732 0 0
卜地锦

大邓和他的python
写了 20804 字，被 532 人关注，获得了 307 个喜欢

公众号：大邓和他的pythonpython
卜地锦

最近在爬知乎，用上代理还被封了本机IP，换一个WIFI就又可以了，请教下博主，有没有什么办法

Python爬虫代理池分享——再也不怕反爬虫
地址：https://github.com/Python3WebSpider/ProxyPool 为什么需要代理池在爬取网站信息的过程中，有些网站为了防止爬虫，可能会限制每...

造数科技
13350 3 18
卜地锦

headers不加上登陆令牌不会直接503吗

Python 编写知乎爬虫实践
本文经作者授权发布。文 | 程柳锋@Tencent 爬虫的基本流程网络爬虫的基本工作流程如下：首先选取一部分精心挑选的种子 URL 将种子 URL 加入任务队列从待抓...

罗义的夏天
5281 1 2
卜地锦

呓语_yiyu
写了 12385 字，被 187 人关注，获得了 232 个喜欢

爱编程、爱音乐、爱读书 专注C/C++、Python 没事也写写读书笔记 只想安安静静写个程序 在这呓语几句，别当真 _(:з」∠)_ 欢迎去我的博客踩踩： <a href="https://links.jianshu.com/go?to=http%3A%2F%2Fyangyingming.com" target="_blank">http://yangyingming.com</a>

卜地锦

请教下大佬，我也在抓这个数据，用上代理之后，一小时超过6W条还是很容易被封。User-Agent我弄了几十个，登录令牌，也就是'authorization'，没有登陆账号都是一样的，搞不懂知乎是怎么识别出来

如何写一个简单的分布式知乎爬虫？
前言很早就有采集知乎用户数据的想法，要实现这个想法，需要写一个网络爬虫（Web Spider）。因为在学习 python，正好 python 写爬虫也是极好的选择，于是就写...

呓语_yiyu
11695 12 148
卜地锦

@Deserts_X 还没想好，据说知乎有6500万注册用户，我想把大部分用户爬下来

爬取张佳玮138w+知乎关注者：数据可视化
一、前言作为简书上第一篇文章，先介绍下小背景，即为什么爬知乎第一大V张公子的138w+关注者信息？其实之前也写过不少小爬虫，按照网上各种教程实例去练手，“不可避免”的爬过...

古柳_Deserts_X
14585 32 152 4
卜地锦

Wakingup88688
写了 26922 字，被 354 人关注，获得了 281 个喜欢

个人博客已迁到 <a href="http://weiyanying.com/" rel="nofollow" target="_blank">http://weiyanying.com/</a> flask搭建的网站<a href="https://wakingup.herokuapp.com/" rel="nofollow" target="_blank">https://wakingup.herokuapp.com/</a>
卜地锦

古柳_Deserts_X
写了 170264 字，被 7786 人关注，获得了 2369 个喜欢

微信公众号：牛衣古柳 微信：xiaoaizhj 备注「可视化加群」 GitHub：<a href="https://links.jianshu.com/go?to=https%3A%2F%2Fgithub.com%2FDesertsX" target="_blank">https://github.com/DesertsX</a> 喜欢数据可视化/D3.js “如切如磋，如琢如磨”，知一切事皆如此，不可安于小成而不自勉益求精进也。——钱穆《论语新解》 知乎：Deserts X： <a href="https://links.jianshu.com/go?to=https%3A%2F%2Fwww.zhihu.com%2Fpeople%2FDeserts-X%2Factivities" target="_blank">https://www.zhihu.com/people/Deserts-X/activities</a>
卜地锦

我这两天也在抓张佳玮的粉丝数据，现在有142万条了，貌似一小时抓六万条就是知乎的红线，速度高一点就返回503，来回折腾好几次了

爬取张佳玮138w+知乎关注者：数据可视化
一、前言作为简书上第一篇文章，先介绍下小背景，即为什么爬知乎第一大V张公子的138w+关注者信息？其实之前也写过不少小爬虫，按照网上各种教程实例去练手，“不可避免”的爬过...

古柳_Deserts_X
14585 32 152 4

卜地锦

简单的验证码识别
作为学了两个多月python的小白，深深地感受到“由此可得”的恶意，所以文章力求详细。 1.工具和环境语言： python3.5 系统：win7 64位浏览器：chrom...

3255 0 1
卜地锦

程序员
小彤花园编，96302 篇文章，1664445 人关注

如果你是程序员，或者有一颗喜欢写程序的心，喜欢分享技术干货、项目经验、程序员日常囧事等等，欢迎投稿《程序员》专题。专题主编：小彤花园 http://www.jianshu.com/users/4a4eb4feee62/ 【程序员】专题拒稿指北：http://www.jianshu.com/p/7c8b33b5f63b 投稿须知： 1.收录相关技术文章，但不限于技术，也可以是项目经验类的文章和程序员日常。 2.文章內不得有任何推广信息。包括但不限于公众号、微博、微信，更不得在通过投稿后再修改文章加入推广信息。你可以将这些推广以及个人信息放在个人主页介绍里。 3.字数极少，段落混乱，大段代码没有放到代码框的文章不收录 4.不相关的内容不收录，请确认文章内容和本专题相关目前针对优质作者及爱好者，开设了官方程序员微信群，希望加入请发简信给主编小彤花园索取个人微信，主编会将你加入到【程序员】微信群，分享内容，收获知识。添加微信时备注昵称。
卜地锦

@IT·互联网
若锦编，67650 篇文章，2652911 人关注

Hi，很高兴在@IT·互联网专题遇见你。收录范围：收录IT&互联网行业观察与思考，数码产品极客体验分析等类型文章投稿须知：https://www.jianshu.com/p/4edc76104c27 专题主编：@若锦 https://www.jianshu.com/u/e4c63b354a77 官方社群：可联系添加 @若锦加入专题官方社群交流、学习，添加时备注简书ID。
卜地锦

咖喱py
写了 80673 字，被 4543 人关注，获得了 599 个喜欢

从0开始的python学习
卜地锦

北邮老土
写了 465042 字，被 79946 人关注，获得了 680 个喜欢

卜地锦

与蟒唯舞
写了 51754 字，被 1842 人关注，获得了 824 个喜欢

热衷于各种新鲜有趣的技术，喜爱分享纯技术干货！ GitHub：<a href="https://github.com/happy-python" rel="nofollow" target="_blank">https://github.com/happy-python</a>
卜地锦

产业深观
写了 7879905 字，被 518548 人关注，获得了 7811 个喜欢

深度洞察产业，厘清行业未来。