由于最近需求要用python做些数据分析,所以开始抽空着手python的学习。以下是近期的总结:
windows环境下:
1.编译器的安装: 官网:https://www.python.org/,下载的时候
例如windows环境会出现几个版本选项,
(1).如果要下载基于网页的安装程序: Download Windows x86-64 web-based installer
(2).如果要下载可执行的安装程序: Download Windows x86-64 executable installer
(3).如果要下载python程序的压缩包: Download Windows x86-64 embeddable zip file
一般选择第二个可执行的安装程序。
下载完,进行安装的时候注意配置环境变量,安装界面有个add PATH,直接打勾就ok了。
完事后,就可以在cmd里面输入python进行检验一波成功没?
下面就需要一款编辑器,推荐sublime text3,首先在工具栏下新建编译系统,内容如下:
保存名为Python3。注意:这里D:/python37/python.exe是具体安装python的目录。然后选择Python3的编译系统,按Ctrl+b就可以运行py文件。
2.python库的安装: window下的库安装很简单,需要什么库就直接在cmd界面进行 pip install 库名(注意:python3以上有pip和pip3,所以执行pip和pip3安装指令都是可以的)。
3.库的引用: import 库名 表示引用此库;from 库名 import 模块 表示引用某个库的某个模块(例如: from requests_html import HTMLSession)。
4.python与php很大不同点:php是单继承(traits可以弥补这个短处),但python却支持多继承。代码如下:
class Human:
def __init__(self, sex):
self.sex = sex
def p(self):
print("这是Human的方法")
class Person:
def __init__(self, name):
self.name = name
def p(self):
print("这是Person的方法")
def person(self):
print("这是我person特有的方法")
class Teacher(Person):
def __init__(self, name, age):
super().__init__(name)
self.age = age
class Student(Human, Person):
def __init__(self, name, sex, grade):
Human.__init__(self,sex)
Person.__init__(self,name)
self.grade = grade
5.一些库的使用:
pandas库:主要用于数据的分析统计处理。
requests_html、urllib.request库:用于爬取网页内容。
例:
from requests_html import HTMLSession
session = HTMLSession()
r = session.get(url)
print(r.html.text)//这就可以看到这个地址的文本内容了
有的网站有反爬虫机制,需要伪造请求头:
写的一个简单的爬虫小demo:
itchat微信库:用于微信操作。
re库:用于正则的处理。