一、步骤
面向对象,数据分析案例,主业务逻辑代码
实现步骤:
1. 设计一个类,可以完成数据的封装 data_define.py
2. 设计一个抽象类,定义文本读取的相关功能,并使用子类实现具体功能 file_define.py
3. 读取文件,生产数据对象
4. 进行数据需求的逻辑计算(计算每一天的销售额)main.py
5. 通过pyecharts进行图形绘制 index.html
6. 链接数据库,把数据写入到数据库中 main.py
注意事项:
1. file_define把读取文件获取到的数据整理成list[Record]的数据类型进行返回
2. 在main文件中把两个文件的数据合并后处理成dict的数据格式,以date为key,以money为value
3. 命名的时候不要跟特殊关键字重名
二、代码
2.1 data_define.py 数据的规范封装类
"""
设计一个类,可以完成数据的封装
"""
class Record:
# 初始化成员变量
def __init__(self, date, order_id, money, province):
self.date = date
self.order_id = order_id
self.money = money
self.province = province
# 以自定义的方式输出对象内容
def __str__(self):
return f"{self.date} {self.order_id} {self.money} {self.province}"
2.2 file_define.py 文件读取类的封装(多态的使用,抽象类)
"""
设计一个抽象类,定义文本读取的相关功能,并使用子类实现具体功能
"""
import json
from data_define import Record
class FileReader:
def read(self) -> list[Record]:
"""读取文件"""
pass
# 读取txt文件
class TxtFileReader(FileReader):
def __init__(self, file_name):
# 获得文件路径
self.file_name = file_name
# 重写父类读文件操作
def read(self) -> list[Record]:
list_record: list[Record] = []
with open(self.file_name,"r",encoding="utf-8") as f:
lines = f.readlines()
for line in lines:
# 去除首尾的空格及换行符
line = line.strip()
# 以逗号进行分割
line = line.split(",")
# 匹配生成record对象实例
record = Record(line[0], line[1], int(line[2]), line[3])
list_record.append(record)
return list_record
# 读取json文件
class JsonFileReader(FileReader):
def __init__(self, file_name):
self.file_name = file_name
def read(self) -> list[Record]:
list_record: list[Record] = []
with open(self.file_name,"r",encoding="utf-8") as f:
lines = f.readlines()
for line in lines:
line = line.strip()
line = json.loads(line)
record = Record(line["date"],line["order_id"],int(line["money"]),line["province"])
list_record.append(record)
return list_record
# 调试代码
if __name__ == "__main__":
f_txt = TxtFileReader("../90 类-综合案例-数据分析案例/2011年1月销售数据.txt")
for record in f_txt.read():
print(record)
f_json = JsonFileReader("../90 类-综合案例-数据分析案例/2011年2月销售数据JSON.txt")
for record in f_json.read():
print(record)
2.3 main.py 主文件的编写
"""
面向对象,数据分析案例,主业务逻辑代码
实现步骤:
1. 设计一个类,可以完成数据的封装
2. 设计一个抽象类,定义文本读取的相关功能,并使用子类实现具体功能
3. 读取文件,生产数据对象
4. 进行数据需求的逻辑计算(计算每一天的销售额)
5. 通过pyecharts进行图形绘制
"""
# 导入包
# 处理数据
# 渲染统计表
from data_define import Record
# 为了规范数据类型
from file_define import FileReader, TxtFileReader, JsonFileReader
from pyecharts.charts import Bar
from pyecharts.options import *
# 导入全部模块
from pyecharts.globals import ThemeType
# 设置图标主题
from pymysql import Connection
# 导入pymysql包
txt_file_reader = TxtFileReader("../90 类-综合案例-数据分析案例/2011年1月销售数据.txt")
json_file_reader = JsonFileReader("../90 类-综合案例-数据分析案例/2011年2月销售数据JSON.txt")
# 获取文件list数据--使用类型注解
txt_list_data:list[Record] = txt_file_reader.read()
json_list_data:list[Record] = json_file_reader.read()
# 合并两个list数据--使用类型注解
all_list_data:list[Record] = txt_list_data + json_list_data
# 定义空的字典 以date作为key money作为value
dict_data: dict[str, int] = {}
# 第一遍写的时候卡壳了
for record in all_list_data:
if record.date in dict_data:
dict_data[record.date] += record.money
else:
dict_data[record.date] = record.money
# 绘制图标
# bar 实例对象 设置图标主题
bar = Bar(init_opts=InitOpts(theme=ThemeType.DARK))
# 需要转换为需要的list类型
# print(dict_data.keys(), list(dict_data.keys()))
bar.add_xaxis(list(dict_data.keys()))
# 去掉y轴的提示数字 ctrl+p可以查看参数
bar.add_yaxis("每日销售额",list(dict_data.values()),label_opts=LabelOpts(is_show=False))
# 全局设置图标配置项
bar.set_global_opts(
title_opts=TitleOpts(title="每日销售额统计图")
)
# 自定义渲染网页文件
bar.render("index.html")
# 数据库处理代码
# 构建mysql链接对象
conn = Connection(
host="localhost",
port=3306,
user="root",
password="root"
)
# 获取游标对象
cursor = conn.cursor()
# 组织sql语句
# 选择数据库
conn.select_db("my_data_base")
# 创建表 需要设置列及列的类型
cursor.execute("create table py_data_static(date Date, order_id varchar(100), money int, province varchar(100))")
# 执行sql语句
# 假设你使用的是一个支持参数化查询的数据库库
for record in all_list:
insert_str = f"INSERT INTO py_data_static (date, order_id, money, province) VALUES ('{record.date}','{record.order_id}',{record.money},'{record.province}')"
cursor.execute(insert_str)
# 关闭mysql链接对象
conn.close()
三、实现效果
四、问题总结
1. 在遍历list的时候,不知道如何判断某一项作为dict_data的键是否存在,感觉是Record规范数据的原因,所以可以通过record.date获取到日期值
2. 在设置图标类型的时候,ctrl+p的时候没使用好,回去看了视频才写出来
3. 在读取文件过程中命名不是很规范,对于数据类型不敏感的原因
五、本地文件部分截图
5.1 2011年1月销售数据.txt
5.2 2011年2月销售数据JSON.txt
tips:可以按照本地文件部分截图,自己造数据做演示。
有问题,欢迎留言评论~~