首先,Train_data.skew()计算出每个特征的偏度值(峰度值同理)。图是直方图,展示离散型分组数据的分布情况。至于为什么要把所有特征的偏度值放到一张直方图上,是为了告诉我们 我们手里的这些特征的偏度分布情况,根据图能看出,大部分特征偏度集中在0附近,说明大部分特征分布对称,没有问题。当然也存在偏度异常情况,针对偏移严重的数据
2021-04-23
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 二手车数据探索性分析EDA Tip:此部分为零基础入门数据挖掘的 Task1 赛题理解 部分,为大家入门数据挖掘比...
- 疑问:#use make_scorer to convert a metric to a scorer. 连续:'...