上文介绍了如何获取二手房价数据以及数据的清洗,本文将利用python的画图工具包matplotlib对这些数据做一些简要的分析。
(1)直方图(分布图)
从直方图中可以看出,上海市二手房的平均价格大概在5万/平方米,总体呈现右偏分布,说明每平米的房屋均价存在极大值,使得平均值大于中位数。
(2)箱线图
从箱线图中可以看出,数据有些离散,且有较多的异常值分布在右侧,和直方图所呈现出的右偏分布一致。
(3)折线图
如上图所示,折线图中分别比较了上海各个地区房价的最高价、均价和最低价。通过比较可以发现,徐汇、静安、长宁、浦东等地区的房价差异较大,而崇明和金山房价差异较小。如果只比较均价的话,从图中可以发现黄埔、徐汇、静安等地区的房价相对较高。
(4)散点图
上图横轴为房间的面积,纵轴为房屋总价。从图中可以看出,房屋的总价和房屋面积呈现出正相关关系,随着房屋面积的增加,房屋总价也在增加。且金山区的房屋面积集中在100到400平左右,而长宁区的房屋面积则比较分散。
(5)雷达图
从雷达图中可以看出,相对而言,徐汇地区的医疗资源较为丰富,浦东的地铁相对较多,而松江地区的公园较多(可能是因为在郊区)