
1. 定义 SQL是:关系型数据库,以Oracle、MySql为代表的数据库 NOSQL就是Not Only SQL,是:非关系型数据库,以MongoDB、Redis为代表的...
1. MongoDB 简介 MongoDB是一个可扩展的高性能,开源,模式自由,面向文档的NoSQL,基于分布式文件存储,由 C++ 语言编写,设计之初旨在为 WEB 应用提...
Handler处理器 和 自定义Opener 1. 概述 opener是 urllib2.OpenerDirector 的实例,我们之前一直都在使用的urlopen,它是一个...
1. urllib2的异常错误处理 在我们用urlopen或opener.open方法发出一个请求时,如果urlopen或opener.open不能处理这个response,...
1. 网页抓取 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中抓取出来。在Python中有很多库可以用来抓取网页。 在python2中自带urllib和urllib...
我们先来看一下浏览网页的基本过程,比如我们在浏览器地址栏输入:http://www.baidu.com,回车后会浏览器会显示百度的首页。 简单来说这段过程发生了一下四个步骤:...
大数据时代,要进行数据分析,首先要有数据源,有了数据源从而可以更好的进行搜索引擎优化,同时python爬虫,可以私人订制一个搜索引擎. 1,简单分类及用途 根据使用场景,网络...