Python 数据可视化实战:多维度销售数据分析与图表绘制

Python 数据可视化实战:多维度销售数据分析与图表绘制

本文将通过一个完整的实战案例。读取现有的excel数据,演示如何使用 Python 生成模拟数据、构建多维度分析模型,并结合 matplotlib、seaborn 等库实现 9 种专业图表的绘制。

一、数据读取与存储

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

from matplotlib.patches import Circle

import https://www.xianyuzhuan.cn/mplfinance as mpf

1. 数据

销售数据:包含 5 大地区 × 5 大品类 × 12 个月的模拟数据,包含销售额、利润、销售量、客户满意度等指标。 股价数据: 2023 年 1 月的股票交易数据,包含开盘价、最高价、最低价、收盘价和成交量。

with pd.ExcelWriter('sales_data.xlsx') as writer:

    df.to_excel(writer, sheet_name='销售数据', index=False)

    stock_df.to_excel(writer, sheet_name='股价数据', index=False)

sales_data.xlsx  数据内容:

二、数据可视化方案

我们将通过 9 种图表类型,从不同维度解析销售数据:

三、核心图表解析

以下是对代码中各个可视化图表的详细讲解,帮助读者理解不同图表类型的作用及实现原理:

1. 区域销售对比(条形图)

图表类型:垂直条形图 实现方式:

region_sales = sales_df.groupby('地区')['销售额'].sum().sort_values(ascending=False)

sns.barplot(x=region_sales.index, y=region_sales.values)

核心功能:

通过groupby按地区聚合销售额总和 使用sort_values降序排列,突出高销售区域 Seaborn的barplot自动生成带颜色主题的条形图 分析价值:快速识别销售额最高的地区(如华东),发现区域市场差异。

2. 品类销售分布(柱状图)

图表类型:单色柱状图 代码亮点:

sns.barplot(..., color='green')  # 统一颜色

plt.xticks(rotation=45)          # 标签倾斜防止重叠

设计选择:

使用单一颜色避免多分类颜色干扰 45度标签旋转提升可读性 业务意义:对比不同产品类别(如电子产品 vs 日用品)的销售额贡献。

3. 月度销售趋势(折线图)

关键代码:

monthly_sales = sales_df.groupby('日期')['销售额'].sum()

plt.plot(..., marker='o')  # 添加数据点标记

数据处理:

按日期聚合每日销售额总和 未显式重采样,需确保日期格式为连续序列 趋势洞察:识别销售高峰月份(如11月可能受促销影响)。

4. 品类占比(饼图)

可视化优化:

plt.pie(..., autopct='%1.1f%%', startangle=90)  # 显示百分比,调整起始角度

plt.axis('equal')  # 强制圆形显示

适用场景:展示整体销售构成,但超过5个分类时建议改用条形图。

5. 销售额-利润关系(散点图)

代码细节:

plt.scatter(..., alpha=0.5)  # 半透明点处理重叠

分析维度:

X/Y轴分别映射销售额和利润 点透明度避免高密度区域遮盖 潜在发现:识别离群点(如高销售额低利润的异常订单)。

6. 品类趋势叠加(面积图)

数据重塑:

category_monthly = sales_df.pivot_table(...)  # 生成日期-类别矩阵

图表特性:

面积堆叠显示总量趋势 颜色区分品类贡献比例 趋势解读:观察不同品类随时间的增长/衰退模式(如服饰类季节性波动)。

7. 地区占比(圆环图)

实现技巧:

plt.pie(..., wedgeprops=dict(width=0.5))  # 控制环宽

plt.gca().add_patch(Circle(...))         # 中心挖空

对比优势:相比饼图,更突出中心区域的可注释空间。

8. 多维指标(雷达图)

关键步骤:

数据标准化: region_metrics_norm = (region_metrics - min) / (max - min)

角度计算: angles = np.linspace(0, 2*np.pi, len(metrics))

分析价值:综合比较不同地区在销售额、利润等多指标上的均衡性。

9. 三维关系(气泡图)

维度映射:

X轴:销售额 Y轴:利润 气泡大小:销售量 代码实现:

s=data['销售量']/50  # 缩放气泡尺寸

alpha=0.7           # 透明叠加

业务洞察:发现高销售量但低利润的问题组合(需深入分析定价策略)。

知识拓展

布局管理: plt.tight_layout()  # 自适应间距

plt.subplots_adjust(hspace=0.4, wspace=0.3)  # 手动调整

样式统一: sns.set_style("whitegrid")  # 网格背景

plt.rcParams.update({'font.size': 10})  # 统一字体

输出质量: plt.savefig(..., dpi=300, bbox_inches='tight')  # 高清保存

通过组合这些图表,可构建完整的销售分析看板,覆盖分布、趋势、构成、关联等多维度分析需求。实际应用中需根据数据特点调整图表类型,例如时序预测可加入ARIMA模型折线,地理数据可转换地图可视化。

四、技术实现亮点

中文支持优化

plt.rcParams['font.sans-serif'] = ['SimHei']  # 中文显示

plt.rcParams['axes.unicode_minus'] = False  # 负号显示

图表布局管理

plt.tight_layout()  # 自动调整子图间距

plt.savefig('sales_analysis.png', dpi=300, bbox_inches='tight')  # 高质量保存

数据预处理

日期格式标准化(freq='ME' 生成月末日期) 异常值处理(股价数据 price = max(price + change, 50)) 数据聚合(groupby 和 pivot_table 灵活组合)

五、图表选择建议

分析维度 推荐图表类型 适用场景 对比分析 条形图/柱状图 地区/品类销售额对比 结构分析 饼图/圆环图 市场份额占比 趋势分析 折线图/面积图 月度销售变化 多维分析 雷达图 综合指标评估 关系分析 散点图/气泡图 指标相关性探索 时间序列 K线图 金融数据可视化

 源码获取 看原文:Python 数据可视化实战:多维度销售数据分析与图表绘制

Python 数据可视化实战:多维度销售数据分析与图表绘制https://www.kuazhi.com/post/715745095.html

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容