Python DataFrame 检验数据正态分布及平均值差异检验

检验是否为正态分布

使用 # Scipy Normaltest how is it used?

image.png

平均值差异检验

代码示例如下

from scipy.stats import kstest, ttest_ind, levene

# data analysis
print("\n--------- 检验是否为正态分布 ---------")
print(kstest(df_user_fluency['sub_new_list_fluency'], 'norm'))
print(kstest(df_user_fluency['total_new_list_fluency'], 'norm'))
print(kstest(df_user_fluency['sub_fluency'], 'norm'))
print(kstest(df_user_fluency['total_fluency'], 'norm'))

print("\n--------- 检验方差齐性 ---------")
print(levene(df_user_fluency['sub_new_list_fluency'], df_user_fluency['total_new_list_fluency']))
print(levene(df_user_fluency['sub_fluency'], df_user_fluency['total_fluency']))

print("\n--------- 平均值差异性检验 ---------")
print(ttest_ind(df_user_fluency['sub_new_list_fluency'], df_user_fluency['total_new_list_fluency'], equal_var=False))
print(ttest_ind(df_user_fluency['sub_fluency'], df_user_fluency['total_fluency'], equal_var=True))

参考文献
Python正态性检验
Python统计分析:[1]独立样本T检验

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容