注意：该项目只展示部分功能

1.开发环境

发语言：python
采用技术：Spark、Hadoop、Django、Vue、Echarts等技术框架
数据库：MySQL
开发环境：PyCharm

2 系统设计

随着大数据时代的到来，金融行业面临着海量数据的处理和分析需求。传统的数据处理方式已无法满足金融机构对数据实时性、准确性和深度分析的要求。因此，开发一个基于机器学习+django的金融客户行为预测与可视化，能够有效整合和分析金融数据，为金融机构提供决策支持，成为行业发展的必然趋势。

基于机器学习+django的金融客户行为预测与可视化的开发旨在通过先进的大数据技术和可视化工具，帮助金融机构更高效地处理和分析金融数据，从而提升决策的科学性和准确性。通过系统化的数据分析，金融机构能够更好地理解市场动态、客户行为和风险因素，进而优化业务流程，提高服务质量和竞争力。

本研究旨在开发一个基于机器学习+django的金融客户行为预测与可视化，系统通过整合Python、大数据、Spark、Hadoop、Vue、Echarts、MySQL等技术，实现了数据的高效采集、处理、分析和可视化。通过对客户行为、市场趋势和风险因素的深入分析，系统能够为金融机构提供全面的决策支持。本系统主要包括以下几个功能模块：
数据采集与预处理模块：负责从不同数据源收集金融数据，并进行清洗和预处理。
数据分析模块：利用大数据技术对预处理后的数据进行深入分析。
数据可视化模块：将分析结果通过图表等形式直观展示，便于用户理解和决策。
用户管理模块：提供用户登录、权限管理和操作记录等功能。
客户行为分析：通过分析客户的通话时长、联系次数等行为特征，系统能够识别不同客户群体的偏好和需求，客户历史接触间隔和基于行为特征的客户聚类分析。
市场趋势分析：系统能够分析就业市场景气度与客户订阅意愿的关联，以及市场基准利率与定期存款吸引力的变化趋势，就业市场景气度分析和市场基准利率分析。
营销活动效果评估：通过分析不同营销触达方式的效果和营销活动周期性规律，系统能够帮助金融机构优化营销策略，提高营销活动的转化率，不同营销触达方式效果对比和营销活动周期性规律分析。
客户细分与聚类：系统通过聚类分析，将客户分为不同的行为特征群体，为精准营销和个性化服务提供支持，基于行为特征的客户聚类分析。

3 系统展示

3.1 大屏页面

QQ截图20250820230716.png

QQ截图20250820230735.png

QQ截图20250820230751.png

3.2 分析页面

QQ截图20250820230631.png

QQ截图20250820230641.png

QQ截图20250820230651.png

QQ截图20250820230659.png

QQ截图20250820230709.png

3.3 基础页面

QQ截图20250820230802.png

5 部分功能代码

# 初始化Spark会话
spark = SparkSession.builder \
    .appName("FinancialDataAnalysis") \
    .getOrCreate()

# 读取金融数据
df = spark.read.csv("financial_data.csv", header=True, inferSchema=True)

# 数据预处理：处理缺失值和数据类型转换
df = df.na.drop()  # 删除含有缺失值的行
df = df.withColumn("age", col("age").cast("integer"))
df = df.withColumn("loan_amount", col("loan_amount").cast("float"))

# 特征工程：创建新特征
df = df.withColumn("loan_to_income_ratio", col("loan_amount") / col("income"))

# 数据标准化
assembler = VectorAssembler(inputCols=["age", "loan_amount", "loan_to_income_ratio"], outputCol="features")
df = assembler.transform(df)
scaler = StandardScaler(inputCol="features", outputCol="scaled_features")
df = scaler.fit(df).transform(df)

# 聚类分析：KMeans算法
kmeans = KMeans().setK(3).setSeed(1)
model = kmeans.fit(df)
df = model.transform(df)
df = df.withColumn("cluster", when(col("prediction") == 0, "Cluster 1")
                                .when(col("prediction") == 1, "Cluster 2")
                                .when(col("prediction") == 2, "Cluster 3")
                                .otherwise("Unknown"))

# 将聚类结果数据集转换为Pandas DataFrame以便于可视化
cluster_df = df.toPandas()

# 客户行为分析：绘制通话时长与联系次数的柱状图
bar = Bar()
bar.add_xaxis(cluster_df["cluster"].tolist())
bar.add_yaxis("通话时长", cluster_df["call_duration"].tolist())
bar.set_global_opts(title_opts=opts.TitleOpts(title="通话时长与联系次数"))
bar.render("call_duration_bar.html")

# 市场趋势分析：绘制就业市场景气度与客户订阅意愿的折线图
line = Line()
line.add_xaxis(cluster_df["month"].tolist())
line.add_yaxis("订阅率", cluster_df["subscription_rate"].tolist())
line.add_yaxis("平均就业变化率", cluster_df["average_employment_change_rate"].tolist())
line.set_global_opts(title_opts=opts.TitleOpts(title="就业市场景气度与客户订阅意愿"))
line.render("market_trend_line.html")

# 营销活动效果评估：绘制不同营销触达方式的效果对比柱状图
bar = Bar()
bar.add_xaxis(["手机", "固定电话"])
bar.add_yaxis("总联系数", [df.filter(col("channel") == "mobile").count(), df.filter(col("channel") == "landline").count()])
bar.add_yaxis("订阅率", [40.35, 22.27])
bar.set_global_opts(title_opts=opts.TitleOpts(title="不同营销触达方式效果对比"))
bar.render("marketing_effect_bar.html")

# 客户细分与聚类：绘制客户聚类分析的饼图
pie = Pie()
pie.add("", [list(z) for z in zip(cluster_df["cluster"].value_counts().index, cluster_df["cluster"].value_counts().values)])
pie.set_global_opts(title_opts=opts.TitleOpts(title="客户聚类分析"))
pie.render("customer_cluster_pie.html")

源码项目、定制开发、文档报告、PPT、代码答疑
希望和大家多多交流

大数据实战项目-基于机器学习+django的金融客户行为预测与可视化的设计与实现