2023年数学建模美赛春季赛Y题—思路程序总结分享(完整版)

2023年数学建模美赛春季赛Y题—分析二手帆船价格——思路程序总结分享

使用的程序、中间数据、分析结果等资源的获取方式:https://mbd.pub/o/bread/ZJeUl59s

1: 问题描述与要求

与许多奢侈品一样,帆船的价值会随着年龄和市场条件的变化而变化。随附的 “2023_MCM_Problem_Y_Boats.xlsx” 文件包含约3500艘36至56英尺长的帆船的数据,这些帆船于 2020 年 12 月在欧洲、加勒比海地区和美国进行了广告销售。一位划船爱好者向 COMAP 提供了这些数据。 与大多数真实世界的数据集一样,它可能存在数据缺失或其他问题,需要在分析之前进行一些数据清理。

帆船经常通过经纪人出售。 为了更好地了解帆船市场,中国香港 (SAR) 的一位帆船经纪人委托您的团队准备一份关于二手帆船定价的报告。 经纪人希望您:

(1) 开发一个数学模型来解释所提供电子表格中每艘帆船的标价。 包括您认为有用的任何预测因素。 您可以利用其他来源来了解给定帆船的其他特征(例如横梁、吃水、排水量、索具、帆面积、船体材料、发动机小时数、睡眠能力、净空高度、电子设备等)以及按年份的经济数据和地区。识别并描述所有使用的数据来源。 包括对每种帆船型号价格的估算精度的讨论。

(2) 使用您的模型来解释区域对上市价格的影响(如果有的话)。讨论在所有帆船变体中是否有任何区域效应是一致的。解决所指出的任何区域影响的实际和统计意义。

(3) 讨论您对给定地理区域的建模如何在香港 (SAR) 市场中发挥作用。 从提供的电子表格中选择一个信息丰富的帆船子集,分为单体船和双体船。 从香港 (SAR) 市场中查找该子集的可比上市价格数据。 模拟香港 (SAR) 对您子集中帆船的每艘帆船价格的区域影响(如果有的话)。 双体船和单体帆船的效果是否相同?

(4) 确定并讨论您的团队从数据中得出的任何其他有趣且信息丰富的推论或结论。

(5) 为香港 (SAR) 帆船经纪人准备一份一到两页的报告。 包括一些精心挑选的图形,以帮助经纪人理解您的结论。

2: 解题思路和分析结果(详解版)

针对问题1

思路:该问题主要是预测价格的回归模型预测问题。而且可以使用的预测算法有很多种,例如:多元回归分析、Lasso回归、决策树回归、随机森林回归、GBDT回归、支持习那里感激回归等模型。但是使用这些模型时和结合数据的特点进行分析,并且还需要对原始的数据进行很多的预处理与变换操作,提取更有用的特征,方可建立较准确的回归预测模型。如果能够收集到更多的相关数据集,可以增强预测精度。

所以该问题的解决路径应该为:数据清洗——>数据可视化探索性分析——>数据特征工程(筛选与变换)——>建立回归分析模型——>对结果进行分析.

经过我对数据集的相关探索和分析,得出使用随机森林回归预测模型的预测效果较准确。相关数据集的预测效果如下图:


monohulled sailboats价格预测效果


catamarans价格预测效果


针对问题2

该问题主要是要结合问题1的分析结果,进行进一步的分析。分析一些分类变量(例如区域、制造商、年份等)与价格之间的的关系。可以使用定量分析与可视化分析相结合的方式,主要可参考的方法有:方差分析、卡方检验等。经过我对数据的探索和分析,一些可参考的结果如下图:


地区和价格的多重检验结果
不同区域的价格分布情况

针对问题3

该问题属于一个数据相似性对比,然后建立回归模型进行预测的问题。例如:根据收集的而外GDP数据,找到和香港GDP情况相似的地区,然后根据区域找到数据子集,然后对自己进行建模与分析从而作为香港的售价参考模型。如果数据样本较多,可使用聚类分析,将找到的子集划分为更细的子集,对数据进行详细分组和分析。因为最终还是需要建立价格预测模型,所以可以尝试一些回归模型的算法,对数据进行预测,然后作为香港的预测结果。经过我的一些数据真理与分析,一些可参考的结果示例如下所示:


经济数据变化趋势的相似性分析


定价模型的预测值和真实值的对比效果图

针对问题4

讨论您的团队从数据中得出的任何其他有趣且信息丰富的推论或结论。该问题是一个开放性的问题,可以进行一些数据可视化分析等,便于发现数据的关系。并且可以结合前面的结果进行分析。下面真实一些发现的数据规律:

不同地区GDP和价格高低之间的相关性


不同地区下长度和价格之间的关系

总结

前面的一些分析,都是本人使用Python,对数据一步步分析得出的一些经验,供大家参考。数学建模本身就是开放性问题,这里只是抛砖引玉。

使用的程序、中间数据、分析结果等资源的获取方式: https://mbd.pub/o/bread/ZJeUl59s

文章首发与:https://mp.weixin.qq.com/s?__biz=Mzg3MTM4NjI2MA==&mid=2247484826&idx=1&sn=5f49f4c3be56e01e4cb123e62c7e8cbe&chksm=cefe1861f9899177ebaacc490ec5102c56974f6f27fad215b870ca7908be2acf5db78d140564&token=957805254&lang=zh_CN#rd

今天的分享就到这里了,敬请期待下一篇!

最后欢迎大家分享转发,您的点赞是对我的鼓励和肯定!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,110评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,443评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,474评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,881评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,902评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,698评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,418评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,332评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,796评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,968评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,110评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,792评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,455评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,003评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,130评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,348评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,047评论 2 355

推荐阅读更多精彩内容