从不会Hadoop到Spark大屏惊艳,《烟酒成瘾个体数据分析系统》让导师当场改口

💖💖作者:计算机毕业设计小途
💙💙个人简介:曾长期从事计算机专业培训教学,本人也热爱上课教学,语言擅长Java、微信小程序、Python、Golang、安卓Android等,开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。平常喜欢分享一些自己开发中遇到的问题的解决办法,也喜欢交流技术,大家有技术代码这一块的问题可以问我!
💛💛想说的话:感谢大家的关注与支持!
💜💜
网站实战项目
安卓/小程序实战项目
大数据实战项目
深度学习实战项目

@TOC

烟酒成瘾个体数据分析与可视化系统介绍

《烟酒成瘾个体数据分析与可视化系统》面向大四计算机毕业设计需求,依托Hadoop+Spark大数据技术栈,以Python Django与Java Spring Boot双后端版本灵活支撑,前端采用Vue+ElementUI+Echarts构建交互式界面;系统通过HDFS完成烟酒成瘾个体原始数据的高可靠存储,利用Spark SQL与Pandas、NumPy联合进行高效清洗、聚合与建模,深度挖掘成瘾历史、人口统计学特征、健康与生活方式之间的关联关系,并基于机器学习思想对个体未来风险进行量化评估;功能上集成主页、个人信息、密码修改、用户管理四大基础模块,以及成瘾历史分析、人口统计学分析、健康与生活方式分析、风险评估分析四大主题分析模块,最终通过大屏可视化将关键指标以动态图表形式实时呈现,为研究者与决策者提供直观、可交互、可复现的烟酒成瘾个体数据洞察平台,完整覆盖从大数据采集、分布式计算到前端可视化的全链路技术实践。

烟酒成瘾个体数据分析与可视化系统演示视频

[演示视频]https://www.bilibili.com/video/BV15QtqznEsH/?spm_id_from=333.1387.homepage.video_card.click

烟酒成瘾个体数据分析与可视化系统演示图片

登录注册界面.png

用户管理.png

成瘾历史分析.png
风险评估分析.png
健康与生活方式分析.png
人口统计学分析.png

大屏上.png
大屏下.png

烟酒成瘾个体数据分析与可视化系统代码展示

1. 成瘾历史分析:Spark SQL 统计近 30 天每日吸烟量趋势

def smoking_trend_30d(user_id):

spark = SparkSession.builder.appName("smoking_trend").getOrCreate()

df = spark.read.json("hdfs:///smoking_log/*.json") .filter(col("user_id") == user_id) .filter(col("date") >= date_sub(current_date(), 30)) .groupBy("date") .agg(sum("cigarettes").alias("daily_cnt")) .orderBy("date")

trend = df.toPandas().to_dict("records")

spark.stop()

return JsonResponse({"trend": trend})

2. 风险评估分析:基于 Spark ML 预测未来 7 日过量饮酒概率

def alcohol_risk_forecast(user_id):

spark = SparkSession.builder.appName("alcohol_risk").getOrCreate()

df = spark.read.parquet("hdfs:///alcohol_feature") .filter(col("user_id") == user_id) .select("feature_vec") .orderBy(desc("date")).limit(1)

if df.count() == 0:

return JsonResponse({"risk": 0.0})

model = PipelineModel.load("hdfs:///models/alcohol_risk_model")

risk = float(model.transform(df).select("probability").collect()[0][0][1])

spark.stop()

return JsonResponse({"risk": risk})

3. 大屏可视化:实时聚合各学院烟酒共瘾人数并缓存 Redis

def dashboard_college_agg():

spark = SparkSession.builder.appName("dashboard").getOrCreate()

df = spark.read.jdbc("jdbc:mysql://localhost:3306/dms", "user_info",

properties={"user": "root", "password": "root"}) .join(spark.read.jdbc("jdbc:mysql://3306/dms", "addiction",

properties={"user": "root", "password": "root"}), "user_id") .filter(col("smoking_status") == 1) .filter(col("drinking_status") == 1) .groupBy("college") .count() .withColumnRenamed("count", "dual_addict")

data = {row.college: row.dual_addict for row in df.collect()}

cache.set("dashboard_dual_addict", json.dumps(data), 300)

spark.stop()

return JsonResponse(data)

烟酒成瘾个体数据分析与可视化系统文档展示

文档.png

💖💖作者:计算机毕业设计小途
💙💙个人简介:曾长期从事计算机专业培训教学,本人也热爱上课教学,语言擅长Java、微信小程序、Python、Golang、安卓Android等,开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。平常喜欢分享一些自己开发中遇到的问题的解决办法,也喜欢交流技术,大家有技术代码这一块的问题可以问我!
💛💛想说的话:感谢大家的关注与支持!
💜💜
网站实战项目
安卓/小程序实战项目
大数据实战项目
深度学习实战项目

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容