数据来源:python 爬取的链家官网二手房交易数据
数据量:有效数据约30万条,包含信息:'行政区','片区', '小区', '格局', '面积', '楼层', '建成年代', '建成年', '楼体结构', '成交时间', '成交年', '成交月', '成交金额', '平米价', '朝向', '装修', '有无电梯
先来看看基本描述
数据来源于链家2010年到2018年的数据,一个比较基本的概念是:
近几年成交均价是380万,平米均价是4万8。到了2018年5月,成交均价……平米价格。想提醒刚毕业的新社会人:如果想将来在北京安家落户,还得考虑下这个门槛。
成交量by 行政区
代码中间那两行是为了修正 matplotlib显示中文的问题,这个上一篇文章讲过。
图表看出大朝阳成交量最大;其次是海淀,紧接着是丰台,这点比较意外。接着是学区房重地西城区。
各年房价走势:
python这一点很糟糕,print出来的结果小数位数大,而且字段多了无法容纳,很难观察数据。我想出来的解决办法是存储结果之后重新读取作图。
先看朝阳区的均价,在2017年达到高峰后,2018年,的确是降了,但依降得不多。
看全市
此时再次眼花。区域太多,颜色有限,都快分不清丰台和西城的颜色,差点误以为丰台的均价最高位。
那就中心城区和卫星城分开看好了
干净。
我们看到最核心这几个区域,西城东城海淀分别占据成交均价前三位,他们都在2015-2017年有着疯狂的涨幅。学区房重地西城的交易均价在2017年超过10万/平。
再看第二梯队和第三梯队:
门头沟区在2015-2017房价疯涨期间居然比第三梯队其他三个区涨幅都快,当然2017年之后,跌幅也更大(看斜率)
回到题目的疑问:降了,降得不多,后续会分析2018年的走势。
待续……