写文章 注册 登录
  • 首页
  • 下载App
  • 会员
  • IT技术
240
发简信
菇凉别害怕啊我又不是什么好人
  • 7

    关注
  • 3

    粉丝
  • 1

    文章
  • 33

    字数
  • 2

    收获喜欢
  • 1

    总资产
IP属地:湖北
  • 关注的专题/文集/连载 4
  • 喜欢的文章 13
  • 240
    64
    蜗牛仔
    构建IP代理池爬取妹子图片

    同一个目录下创建三个文件 这个是download构建的ip代理池 最后这个是利用西刺代理的IP构造的IP池 还有我不懂,我只构造一个IP代理池的时候中间老是断,不知道什么原因...

    3092 3 16
  • 240
    64
    蜗牛仔
    宜搜全站数十万小说爬虫

    自从看了师傅爬了顶点全站之后,我也手痒痒的,也想爬一个比较牛逼的小说网看看,于是选了宜搜这个网站,好了,马上开干,这次用的是mogodb数据库,感觉mysql太麻烦了下图是我...

    3280 9 51
  • 240
    64
    叶攻攻
    Chapter_one_关于搜索_二,关于深度优先搜索与它所坚持的。

    ·1.2.1_当一切充满不可知的时候,我们都是盲目的。 尽管一切皆不可知,但我们并不能丧失面对未知的勇气,所以让我们勇敢且骄傲地探索这未知的一切吧。 1,2,3这三个数...

    334 1 2
  • 64
    叶攻攻
    Chapter_one_关于搜索_一,什么是暴力枚举?

    ·1.1.1_总是可行的枚举。 假设有一组数:{1,8,9,7,5,6,1,10,6},需要得到其中最大的数的值,对于人来说,显然,最大的数的值为10。但对于计算机来说,它并...

    1301 1 2 1
  • 240
    64
    蜗牛仔
    利用scrapy抓取深圳在链家网的所有租房信息,存进MySql数据库

    这次利用scrapy抓取了深圳所有在链家网的租住房信息,一直对房租价格比较感兴趣,这次终于能利用自己的技能分析一下了,至于为什么现在链家网,时候觉得这里数据比较齐全。这是网址...

    3884 1 14
  • 240
    64
    蜗牛仔
    初步构造代理池1.0版本

    这是第一次亲手尝试写代理池,之前在网站找了很多教程都没有看懂,于是按照自己的思路写一个简易版,目前这个是雏形,后面要加进多线程来检验IP以及通过更多的代理网站来爬取有效IP,...

    380 3 6
  • 240
    64
    蜗牛仔
    利用多线程+多进程以及代理池快速爬虫妹子图片

    哎,太晚了,有空再写注释 首先是队列文件mongodb_queue的代码,复制卧槽哥的 获取主题页面all_theme_urls的代码 这里是多线程多进程代码 15分钟爬了两...

    732 0 11
  • 240
    64
    蜗牛仔
    用scrapy爬取读远网站书籍信息

    这里是spiders 这是pipeline文件的代码 这是setting里面的代码,存数据库端口一些信息,以及redis所在的一些信息,因为redis在本机,所以redis的...

    1113 6 6
  • 240
    64
    蜗牛仔
    模拟登陆豆瓣

    伪造data,这里的验证码选择手打,将访问时候的验证码图片下载到本地 登陆结果显示,前面是没有登陆的结果 登陆后

    857 0 4
暂无个人介绍
  • 他关注的专题/文集/连载
  • 他喜欢的文章