利用Python对链家网北京二手房进行简单数据分析

本文主要讲述如何通过pandas对爬虫下来的链家数据进行相应的二手房数据分析,主要分析内容包括各个区,各个小区的房源信息情况

推荐下我自己创建的Python学习交流群960410445,这是Python学习交流的地方,不管你是小白还是大牛,小编都欢迎,不定期分享干货,包括我整理的一份适合零基础学习Python的资料和入门教程。

然后查看是否有数据

#获取总价格全五的数据

house.sort_values('totalprice',ascending=False).head(5)

字符串的处理

接下来我来计算所有户型的个数,然后用图像展示出来

#计算户型的所占的个数,用到value_counts(),排序也给你做好了,你可以清楚的看到所占的个数

housetype = house['housetype'].value_counts()

结果

有于matplotlib不显示中文我在网上查了些资料,得到的解决方案就是加两行代码

图像展示结果,有图像可以清楚的看到数量分布情况

结果

图像展示

户型与看房次数

在售面积分布

#如有错误请指出,谢谢!

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容