一、读取数据
数据内容如下:
ymd,bwendu,ywendu,tianqi,fengxiang,fengli,aqi,aqiinfo,aqiLevel
2018-01-01,3C,-6C,多云,东北风,1-2级,59,良,2
2018-01-02,4C,-6C,多云,东北风,3-4级,60,良,2
2018-01-03,5C,-6C,多云,东北风,5-6级,61,良,2
df = pd.read_csv(data_path)
二、describe 用法
df.describe()
ps:该函数会抽取df中的数字列进行计算
三、mean、max、min 用法
df['bwendu'].mean()
df['bwendu'].max()
df['bwendu'].min()
四、去重 unique 用法
df['fengli'].unique()
五、value_counts值数量统计用法
df['bwendu'].value_counts()
六、协方差cov、相关性corr用法
df.cov() #协方差矩阵
df.corr()
df['bwendu'].corr(df['aqi'])
df['bwendu'].corr(df['bwendu']-df['ywendu'])