python 读取mysql之后写json

今日问题:读取数据库表的全部内容,保存到json中

分析:

python读取数据库

python读取数据库有一下两种方式。

  1. 使用pymysql库,来连接数据库,写对应的sql语句获取数据。
  2. 使用sqlalchemy来构建数据与对象之间的关系,通过pandas来读取数据。

内容保存为json

  1. 引用json库来实现保存文件。其中会遇到汉字为其它编码的问题。
  2. 写入文件的json格式的还原

ORM技术

ORM(Object-Relational Mapping,对象关系映射)技术:指的是把关系数据库的表结构映射到对象上,通过使用描述对象和数据库之间映射的元数据,将程序中的对象自动持久化到关系数据库中。

在Python中,最有名的ORM框架是SQLAlchemy。Java中典型的ORM中间件有:Hibernate,ibatis,speedframework。

SQLAlchemy

SQLAlchemy是Python编程语言下的一款开源软件。提供了SQL工具包及对象关系映射(ORM)工具。可以使用“pip install sqlalchemy” 安装SQLAlchemy模块
SQLAlchemy模块提供了create_engine()函数用来初始化数据库连接,SQLAlchemy用一个字符串表示连接信息:
'数据库类型+数据库驱动名称://用户名:口令@机器地址:端口号/数据库名'

Pandas读写MySQL数据库
我们需要以下三个库来实现Pandas读写MySQL数据库:

  1. pandas
  2. sqlalchemy
  3. pymysql

其中,pandas模块提供了read_sql_query()函数实现了对数据库的查询,to_sql()函数实现了对数据库的写入,并不需要实现新建MySQL数据表。sqlalchemy模块实现了与不同数据库的连接,而pymysql模块则使得Python能够操作MySQL数据库。

json 和dict 互换

import requests
import json
#json字符串转换成字典
dictdata = json.loads(json_str)
 字典转换成json字符串 
jsondata = json.dumps(dict)

读取mysql数据源码

# -*- coding: utf-8 -*-
# 王国的荣耀
#导入numpy、pandas、json包
import os
import json
import pandas as pd
import numpy as np
from sqlalchemy import create_engine

class DataConvert:
    def saveContent(self, path,content):
        try:
            if not os.path.exists(path):
                with open(path, "w", encoding='utf-8') as f:
                    f.write(content + "\n")
            else:
                with open(path, "a", encoding='utf-8') as f:
                    f.write(content + "\n")
        except Exception as e:
            print("error==>", e)

    def save_file(self, path, item):
        # 先将字典对象转化为可写入文本的字符串
        # son.dumps序列化时候对中文默认使用的ascii编码,想要输出真正的中文需要指定ensure_ascii=False
        item = json.dumps(item,ensure_ascii=False)
        try:
            if not os.path.exists(path):
                with open(path, "w", encoding='utf-8') as f:
                    f.write(item + ",\n")
            else:
                with open(path, "a", encoding='utf-8') as f:
                    f.write(item + ",\n")
        except Exception as e:
            print("error==>", e)

    def dataConv(self):
        path = "demodata.json"
        self.saveContent(path, '[')

        #初始化数据库连接,使用pymysql模块
        # MySQL的用户:root, 密码:test, 端口:3306,数据库:mydb
        engine = create_engine('mysql+pymysql://root:test@localhost:3306/webbook')
        # 查询语句,选出employee表中的所有数据
        sql = '''select * from demo;'''

        # read_sql_query的两个参数: sql语句, 数据库连接
        df = pd.read_sql_query(sql, engine)
        column_list = list(df.columns)
        data = np.array(df)
        try:
            for row in data:
                # 循环每一行数据,组装成一个字典,然后得到字典的列表
                item  = dict(zip(column_list, list(row)))
                # 导入json,将列表转为json字符串
                rowd = {'name':item['name'],'imageurl':item['imageurl']}
                self.save_file(path, rowd)
        except Exception as ex:
            print(ex)

        # print(df)
        print('Read to Mysql table successfully!')
        self.saveContent(path, ']')

if __name__ == '__main__':
    data = DataConvert()
    data.dataConv()

python zip 函数

zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。
如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。

语法

zip 语法:
参数说明:

  • iterabl -- 一个或多个迭代器;

返回值

返回元组列表。

实例

以下实例展示了 zip 的使用方法:

a = [1,2,3]
 b = [4,5,6]
 c = [4,5,6,7,8]
# 打包为元组的列表
zipped = zip(a,b)     
[(1, 4), (2, 5), (3, 6)]
# 元素个数与最短的列表一致
 zip(a,c)              
[(1, 4), (2, 5), (3, 6)]
 # 与 zip 相反,*zipped 可理解为解压,返回二维矩阵式
zip(*zipped)         
[(1, 2, 3), (4, 5, 6)]

python 遍历文件夹,文件排序需求

import os
fileList = os.listdir('TestDir')
fileList
['test1.txt', 'test10.txt', 'test11.txt', 'test2.txt', 'test23.txt', 'test28.txt']
fileList.sort(key= lambda x:int(x[4:-4]))
 fileList
['test1.txt', 'test2.txt', 'test10.txt', 'test11.txt', 'test23.txt', 'test28.txt']
#pip install natsort
#Collecting natsort
#Downloading natsort-7.0.1-py3-none-any.whl (33 kB)
#Installing collected packages: natsort
#Successfully installed natsort-7.0.1

 import os
 import natsort
fileList = os.listdir('TestDir')
 fileList
['test1.txt', 'test10.txt', 'test11.txt', 'test2.txt', 'test23.txt', 'test28.txt']
fileList = natsort.natsorted(fileList)
 fileList
['test1.txt', 'test2.txt', 'test10.txt', 'test11.txt', 'test23.txt', 'test28.txt']

参考:
https://www.cnblogs.com/HondaHsu/p/12664831.html
https://www.cnblogs.com/baxianhua/p/8072824.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。