登录注册写文章

2021-05-14

2021-05-14

scrapy爬取贝壳房屋信息兰州，并进行数据分析

1.创建工程

2.在spiders下新建文件兰州.py写入以下代码

3.在items文件下创建以下字段名

4.在pipeline文件在写入保存数据的代码

5.效果展示：

6.相关代码展示：

保存数据为excel文件

class ExcelPipeline(object):

def __init__(self):

self.wb= Workbook()

self.ws= self.wb.active

self.ws.append(['小区名称','楼层','层数','类型','面积'])

self.file_name= "host.xlsx"

def process_item(self,item,spider):

line= [item['title'],item['louceng'],item['he'],item['typ'],item['size']]# 把数据中每一项整理出来

self.ws.append(line)# 将数据以行的形式添加到xlsx中

self.wb.save('home.xlsx')# 保存xlsx文件

return item

def close_spider(self,spider):

# 关闭

self.wb.close()

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

scrapy技巧
一、第一次爬取获得的URL，返回指纹二次爬取 1、在爬虫名.py文件中，按照原来parse的模式创建第二个pars...
mhslwm阅读 296评论 0赞 0
2021-05-07编写测试报告EXCEL附件
# coding:utf-8 from email.mime.applicationimport MIMEAppl...
小敢敢不憨a阅读 464评论 0赞 0
Python爬取房产数据，哪里跌价买哪里，你可能不赚，但我永远不亏
小伙伴，我又来了，这次我们写的是用python爬虫爬取乌鲁木齐的房产数据并展示在地图上，地图工具我用的是 BDP个...
山禾家的猫阅读 247评论 0赞 0
实现Jira上测试用例的下载和执行结果的回填
测试流程从Jira上面自动下载测试用例，标记需要执行的用例；执行自动化测试；回填自动化测试的结果；面临的困难之前...
luizyao阅读 2,488评论 0赞 1
张艺谋要在电影院开“画展”，预告片孙俪都是戏，关晓彤可期待！
今天青石的票圈出镜率最高的，莫过于张艺谋的新片终于定档了。一张满溢着水墨风的海报一次次的出现在票圈里，也就是老谋...
青石电影阅读 10,475评论 1赞 2

赞1赞

赞赏

手机看全文