Python项目收录

爬虫类

  • crawlers
    是一个主要抓取ROSI写真的Scrapy爬虫,主要的spider代码简单易理解。
  • 163spider
    爬取网易客户端内容的小爬虫,主要采用Scrapy框架并配合上Mysql进行数据的存储,对于新人入门比较友好。

工具类

  • retrying
    主要是一个经典的装饰器,来简单地进行retry请求,同时接受大量的参数,能够满足很多的需求场景。
  • LearnPython
    超级不错的入门Python,以写代码实践的方式学习,相信看完这些例子,Python的大部分东西都理解了。
  • huey
    一个简单的任务队列,主要以Redis作为queue,满足基本的需求场景。支持多进程,多线程和协程,以及定时任务和自动重试失败任务。
  • rq
    比上述的任务队列还要简单,具有很低的入门门槛,同样以Redis为queue。

其他类

  • stockholm
    一个股票数据(沪深)爬虫和选股策略测试框架,数据基于雅虎YQL和新浪财经。对于某些做量化投资的人士应该有帮助。
  • maga
    一个使用asycio的DHT爬虫,DHT是一种分布式存储方法。

不好意思呀,还是有点懈怠呢,主要在写一个爬虫框架,所以没有很大的精力去写其他的技术内容,希望大家好好地学习上面的内容呢,都是很好的资源。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • GitHub 上有一个 Awesome - XXX 系列的资源整理,资源非常丰富,涉及面非常广。awesome-p...
    若与阅读 19,008评论 4 418
  • 环境管理管理Python版本和环境的工具。p–非常简单的交互式python版本管理工具。pyenv–简单的Pyth...
    MrHamster阅读 9,247评论 1 61
  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,725评论 6 427
  • 转眼即逝,太匆匆,人生已过二十载; 梦中含泪,有不甘,怎奈何?
    御魂风泽阅读 1,540评论 0 1
  • 今天和大家分享一款适合任何年龄,非常好喝的饮品“生机能量饮" 食材:榴莲一份 蜂蜜10克 蓝莓10颗以上 小黄米1...
    胡小燕_0965阅读 3,369评论 0 0

友情链接更多精彩内容