python单因子探索分析与可视化

satisfaction_level 分析

# @Time : 2018/11/29 21:41

# @Author : Byron

import pandasas pd

import numpyas np

def main():

df = pd.read_csv('./data/HR.csv')

sc_l = df['satisfaction_level']

print(sc_l.isnull())# 打印出对应的行和isnull布尔值

    print(sc_l[sc_l.isnull()])# 打印出cs_l中isnull为true的值

    print(df[sc_l.isnull()])# 打印出df中isnull为true的行

    print(sc_l.mean())# 均值

    print(sc_l.std())# 标准差

    print(sc_l.max())# 最大值

    print(sc_l.min())# 最小值

    print(sc_l.median())# 中位数

    print(sc_l.quantile(q=0.5))# 等价于中位数

    print(sc_l.quantile(q=0.25))# 下四分位数

    print(sc_l.quantile(q=0.5))# 上四分位数

    print(sc_l.quantile(q=0.75))# 下四分位数

    print(sc_l.skew())# 偏度->满意度较高

    print(sc_l.kurt())# 峰度->偏瘦较集中

    print(np.histogram(sc_l.values, bins=np.arange(0.0, 1.1, 0.1)))# 数据分布空间和数值

if __name__ =="__main__":

main()

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容