一、波士顿房价数据涉及的数据维度有:
CRIM:城镇犯罪率
ZN:后院占地面积超过2.5万平方呎的住宅用地比例
INDUS:每个城镇的非零售商业用地的比例
CHAS:(= 1靠近;否则为0)是否靠近查尔斯河
NOX:一氧化氮浓度(10万份)硝酸盐浓度
RM:每个住宅的平均房间数
AGE:1940年以前建成的自住单位的比例
DIS:距离第五波士顿就业中心加权距离
RAD:径向高速公路的可达性指数
税收:每10,000美元的全值物业税率
PTRATIO:城镇的学生与教师比例
B:1000(Bk - 0.63)^ 2 城镇的黑人比例
LSTAT:下层经济阶层百分比
MEDV:1000美元的自住房屋的中位数
二、房价与其它维度数据之间的关联
找到房价区间,等分之,通过Seaborn模块显示多变量图
先分析房价分布情况:
从直方图中可以看到,房价分布整体偏左,整体上符合正态分布,也即低房价和高房价的房子都不多。再来看房价和其它量之间的关系:
1、从图中显示的数据可以发现,犯罪率与价格有一定关系,房价高的犯罪率偏低,但不等于为没有。其中房价最高的犯罪率略有提升,但远远低于低房价的区域:
2、此外,LSTAT(下层经济阶层百分比)与房价似乎也有一定关系,房价偏高时,房价偏高时LSTAT呈下降趋势:
其余分量与房价关系并不密切。