Python
Python 基础
数据类型
- 整数
- 浮点数
- 字符串
- 布尔值
- 空值
变量
常量
通常大写
爬虫
最重要的三点就是: 请求,解析,储存
Python2 与 Python3 爬虫改动
urllib 库与 urllib2 库合并成 urllib 库
urllib2.urlopen() 变成 urllib.request.urlopen()
import urllib.request
response = urllib.request.urlopen("http://www.baidu.com")
Python3 中, 与 urllib 相关的其余组件: error, parse, response, robotparser 均需通过如上方式导入
TCP/IP 协议
TCP 协议 : 物流公司
IP协议 : 配送
IP地址 : 双方地址
HTTP 协议
响应报文状态码
2开头的是正常
3开头的是重定向
4开头的是客户端异常
5开头的是服务器异常