python单因子探索分析与可视化

satisfaction_level 分析

# @Time : 2018/11/29 21:41

# @Author : Byron

import pandasas pd

import numpyas np

def main():

df = pd.read_csv('./data/HR.csv')

sc_l = df['satisfaction_level']

print(sc_l.isnull())# 打印出对应的行和isnull布尔值

print(sc_l[sc_l.isnull()])# 打印出cs_l中isnull为true的值

print(df[sc_l.isnull()])# 打印出df中isnull为true的行

print(sc_l.mean())# 均值

print(sc_l.std())# 标准差

print(sc_l.max())# 最大值

print(sc_l.min())# 最小值

print(sc_l.median())# 中位数

print(sc_l.quantile(q=0.5))# 等价于中位数

print(sc_l.quantile(q=0.25))# 下四分位数

print(sc_l.quantile(q=0.5))# 上四分位数

print(sc_l.quantile(q=0.75))# 下四分位数

print(sc_l.skew())# 偏度->满意度较高

print(sc_l.kurt())# 峰度->偏瘦较集中

print(np.histogram(sc_l.values, bins=np.arange(0.0, 1.1, 0.1)))# 数据分布空间和数值

if __name__ =="__main__":

main()

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

赞1赞

赞赏

手机看全文