上周日的时候,用python写了一个爬虫,抓取了杭州各个区的二手房信息,并简单分析了一下。本意是进行python爬虫练习,但是看着抓取后的数据,再也无心学python了~ orz=3
具体代码参见我的另一篇简书吧《Python爬虫代码--链家杭州二手房》(我能说我还没有学会markdown语法规则吗)
先来一张抓取完成后的效果图,数据抓取时间为2017年10月15日,总计6533条信息,抓取完毕后以csv格式储存于excel中。不得不说pandas的to_csv方法非常好用啊,傻瓜式的数据写入方式。
随意的选取了几个有代表性的城市,比较了一下二手房市场行情,发现杭州的二手房量是真心不多,库存量落在了第三梯队中。上海则不愧为魔都,二手房市场量遥遥领先,已经和其它芸芸众生不在一个世界中了。
以二手房均价为指标绘制热力图,红色代表价格高的地区,蓝色代表价格低的地区。可以看出价格高的地段首先是主城区,以西湖区和上城区为代表;另外则是沿江地段,以钱塘江两岸为热点进行分布。
为了对杭州二手房房价有个直观概念,以5000为组距,绘制了均价的直方图。均价呈正态分布,价格主要集中在2-4.5万这个区间段内,低于2万的二手房大概只占了10-15%
具体到杭州各个区,哪个区的房价最高呢?简单看下各区的均价情况,上城区和西湖区以4万的均价,位列第一梯队(不了解杭州的同学,光看这区域的名字,都能感觉到房价肯定要上天啊);江干、滨江、拱墅和下城区则是第二梯队;余杭、下沙和萧山区则在第三梯队,价格相对比较亲民(这算哪门子的亲民啊。。摔桌子)。
各区域更详细点的均价情况,可以看下箱形图。每个区都有价格高的突破天际的二手房,也有价格低到你以为出了杭州的二手房。
光看均价其实并不能说明问题,因为房屋还分了商住两用和住宅类。商住两用房的价格很美好,以183万的平均总价(车库排除在外),只有普通住宅的一半不到,但是商住两用房带来的是购房以后电费、水费及物业费的相对高昂,以及未来政策形势不明朗而产生的各种风险。
再看各个区的二手房库存情况。西湖区有着最多的二手房,同时也有着第一梯队的房价,让广大买房族们的购房选择顿时少了很多。余杭区则因为行政区域面积大,房量也占到了17.5%,余杭区的房价较为低廉,若不是因为没有地铁,也不失为一个购房良好选择。
在各区域中,下沙区可以算是屌丝逆袭的典型了。三四年前的下沙,地铁一号线的终点还在文泽路站(也就是图中间的那一部分),下沙因为交通不便、工厂数量多的原因,一直不被人青睐。如今一号线已经修到了下沙江滨站(图中沿江的那一部分),使下沙的交通问题得以解决,另外政府对下沙的环境问题也提高了重视程度,将一些污染较为严重的药厂搬离了下沙,使得如今下沙的房价也蹭蹭蹭的往上涨,或许以后的下沙就是“当初对我爱答不理,现在让你高攀不起”的深刻代表了。
最后来关心一下土豪们的生活方式,最低也要1800万一套的房子,吃瓜群众们在一旁瑟瑟发抖。如果有住在下列小区的土豪,一定要记得联系我,抱大腿啊。
位列仙班的Top3小区,则是远离都市的喧嚣,不食人间烟火了。毗邻各大风景区,确实是修身养性好去处。
看到文章最后的,送上一个比较实用的图,那就是总价低于200万的普通住宅类二手房地图分布图。