最近想要开始入手学爬虫,在4月春末,将这个执行意图变成每周有时间真的上手。
本文精选了 Python开发者 1月份的10篇 Python 热文。其中有基础知识,爬虫项目实战,数据库,web开发等。
本文主要内容为以最短的时间写一个最简单的爬虫,可以抓取论坛的帖子标题和帖子内容等。还没写过爬虫的萌新们可以看过来咯~
Python和Javascript都是脚本语言,所以它们有很多共同的特性,同时也有很多差异,本文作者对这两门动态语言的一些语法以及概念上的异同点进行了简单的总结。
Python是一个很棒的语言,对于任何安全专家它都是一个有用的知识。Internet是巨大的,这也是为什么OSINT技术对搜集,分析和呈现这些信息是至关重要的。本文可以看到,通过使用一点Python语句,就能收集到关于个人或者集体的大量的信息,因此我们可以很容易的写出复杂的OSINT工具。
正则表达式(regular expression)是可以匹配文本片段的模式。本文全面的介绍了Python中正则表达式相关的模块以及使用方法。
Python作为面向对象语言,也提供了对于函数式编程的支持,虽然并不是那么纯粹,而且也不支持尾递归优化。本文介绍了如何使用Python进行简单的函数是编程。
Python有许多方便的爬虫框架来帮助我们快速编写出高质量的爬虫程序。对于一个普通的网络爬虫功能,Scrapy完全胜任,并把很多复杂的编程都包装好了。本文会介绍如何Scrapy构建一个简单的网络爬虫。
本文作者最近刚刚用python写完了一个解析protobuf文件的简单编译器,深感ply实现词法分析和语法分析的简洁方便。越是乘着余热未过,头脑清醒,记下了总结和心得,方便各位pythoner参考使用。
MongoDB是一个NoSQL数据库。近几年来它越来越受到整个行业的欢迎。
在这篇文章中,将向您展示如何使用Python链接目前主流的MongoDB数据库,主要使用PyMongo和MongoEngine。同时比较SQL和NoSQL。
学过PHP的都了解,php的正式环境部署非常简单,改几个文件就OK,用FastCgi方式也是分分钟的事情。相比起来,Python在web应用上的部署就繁杂的多,主要是工具繁多,主流服务器支持不足。本文总结了Python的web部署方式。
Celery 是一个由 Python 编写的简单、灵活、可靠的用来处理大量信息的分布式系统,它同时提供操作和维护分布式系统所需的工具。本文就对这一分布式队列神奇Celery进行了介绍。
Ref Python开发者:从零开始的 Python 爬虫速成指南,10篇 Python 技术热文