利用pandas实现描述性统计
Python的pandas库已经内置了描述性统计的常用函数,在使用pandas对数据集进行描述性统计时,读取数据后,直接调用函数即可。
常用代码如下:
#读取方式1:导入字典
df1=pd.DataFrame({'col1':[1, 2], 'col2':[3, 4]})
#读取方式2:导入csv
df2=pd.read_csv('file_path')
#读取方式3:读取sql
df3.pd.read_sql(sql_name, conn)
#单个变量描述性统计:其余聚合函数可类似处理
df2.HP.mean()
df2.HP.skew()
df2.HP.kurt()
#多个变量描述性统计
df2.describe()