登录注册写文章

Scrapy数据写入数据库（MySQL等）超简单写法

Scrapy数据写入数据库（MySQL等）超简单写法

网上看了很多写入数据库的Pipeline写法，一般都要自己写SQL，另外，如果一个工程里有多个spider还要分别处理。我试了一下用sqlalchemy和pandas两个常用的库写，只要两行代码，非常简单！开始爬取数据时，会直接使用spider的name创建数据表写入数据。

下面是我写的一个例子：

from sqlalchemy import create_engine
import pandas as pd

class CarpricespiderPipeline(object):

    def __init__(self):
        # pip install pymysql
        # pip install mysqlclient 未安装会报错
        self.engine = create_engine('mysql://root:root@localhost:3306/carprice?charset=utf8', echo=False)

    def process_item(self, item, spider):
        # 用pandas读取item
        df = pd.DataFrame([item,])
        # 使用DataFrame的to_sql方法
        df.to_sql(name=spider.name, con=self.engine, if_exists='append', index=None)
        return item

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

将CSV文件写入到MySQL中（用Pandas库实现MySQL数据库的读写）
转载自公众号：python-china 转载自公众号：python-china 本次分享将介绍如何在Python中...
苍简阅读 11,067评论 5赞 6
用Pandas库实现MySQL数据库的读写
用Pandas库实现MySQL数据库的读写 ORM技术对象关系映射技术，即ORM（Object-Relation...
羋学僧阅读 4,704评论 0赞 2
Flask Web Development 第五章读书笔记数据库
第五章数据库序：什么是数据库数据库按规则保存程序数据，程序发起查询取回数据。Web 程序最常使用基于关系模型...
科幻经典阅读 4,264评论 0赞 1
pandas库之读写文本格式的数据
pandas提供了一些用于将表格型数据读取为DataFrame对象的函数。表6-1对它们进行了总结，其中read_...
samoyer阅读 5,129评论 0赞 1
春天
绿意点缀世界之前，生命一冬安眠，蠢蠢欲动，戳破长天。空气里，生命恣意生长，嗡嗡回旋。繁盛，蓬勃，似希望之剑...
铃尘阅读 3,607评论 2赞 7

赞1赞

赞赏

手机看全文