2023美赛C题王牌建模过程,ARIMA + BertNLP 进阶版,全网独家,提供完整代码+思路+文章,助美赛一臂之力!

23美赛正在火热进行时,我们团队已经把文章安排好啦!以及咱们的王牌思路哦!

这是我们团队的一些工作!可以看看~

23美赛(C题)数学建模完整代码+建模过程全解全析(王牌) (mbd.pub)





问题一:报告结果的数量每天都在变化。


建立一个模型来解释这种变化使用您的模型为3月份报告的结果数量创建一个预测区间 用数学建模进行建模:


建立一个时间序列模型来解释每天报告结果的数量变化。该模型可以包括以下因素:季节性因素(例如周末和工作日之间的变化)、假期因素(例如国定假日)、推广因素(例如Wordle在社交媒体上的推广)、单词选择因素(一些单词可能更具挑战性,导致玩家减少)等。

为了预测3月1日的报告结果数量,可以使用时间序列模型的预测功能,并计算预测区间。预测区间将告诉我们,在给定置信水平下,预测的结果数量将落在哪个区间内。可以使用历史数据来估计时间序列模型的参数,并使用这些参数来进行预测。


具体地,我们使用时间序列分析方法。我们可以使用ARIMA模型,它是一种广泛使用的时间序列预测模型。ARIMA模型具有良好的建模灵活性和准确性,可以帮助我们捕捉数据的趋势、季节性和随机性成分。


首先,我们需要检查时间序列数据是否平稳,即是否具有恒定的均值和方差。我们可以使用ADF检验或KPSS检验来进行这个检查。如果时间序列数据不平稳,我们可以使用差分或转换方法来使其平稳。


接下来,我们需要确定ARIMA模型的参数。这些参数包括AR(自回归)阶数,I(差分)阶数和MA(移动平均)阶数。我们可以使用ACF和PACF图来帮助我们选择这些参数。一旦我们确定了模型参数,我们可以使用历史数据来拟合ARIMA模型,并进行模型诊断和预测。

为了创建一个预测区间,我们可以使用拟合的ARIMA模型来预测未来的数据。我们可以使用置信区间来表示预测的不确定性范围,通常使用95%置信区间。

用R语言进行ARIMA建模的示例代码:


#加载数据

data <- read.csv("results.csv")

#转换为时间序列

ts_data <- ts(data$report_count, frequency=7)

# ADF检验

adf_test <- adf.test(ts_data)if(adf_test$p.value > 0.05){

#时间序列数据不平稳,进行差分

  diff_data <- diff(ts_data)

# KPSS检验

  kpss_test <- kpss.test(diff_data)

  if(kpss_test$p.value < 0.05){

#差分后的数据仍不平稳,可以尝试其他转换方法

  } else {

#差分后的数据平稳,使用ARIMA模型拟合

    fit <- arima(diff_data, order=c(1,0,1))

#模型诊断

    checkresiduals(fit)

#预测

    forecast <- predict(fit, n.ahead=31)

#构建置信区间

    lower <- forecast$pred - 1.96 * forecast$se

    upper <- forecast$pred + 1.96 * forecast$se

  }} else {

#时间序列数据平稳,直接使用ARIMA模型拟合

  fit <- arima(ts_data, order=c(1,0,1))

#模型诊断

  checkresiduals(fit)

#预测

  forecast <- predict(fit, n.ahead=31)

#构建置信区间

  lower <- forecast$pred - 1.96 * forecast$se

  upper <- forecast$pred + 1.96 *forecast$se

}



问题一子问题:这个词的任何属性会影响被报告的分数的百分比吗?在困难模式下玩呢? 如果有,怎么做? 如果不是,为什么不是?


为了确定这些属性如何影响Wordle的得分,可以进行统计分析和建模。例如,可以使用回归模型来确定单词长度、字母频率和字母位置等因素对得分的影响程度。可以收集足够数量的样本数据,然后将这些数据分成训练集和测试集,使用训练集来训练回归模型,并使用测试集来评估模型的性能和准确度。

在困难模式下,还可以对猜测字母的位置进行建模,以确定猜测字母的正确位置对得分的影响程度。可以使用分类模型来确定每个字母在单词中的位置,然后根据这些位置对猜测的字母进行评分。

总之,诸如单词长度、字母频率和字母位置等因素都可能影响Wordle的得分。可以使用统计分析和建模来确定这些因素对得分的影响程度,并在困难模式下特别关注字母位置的影响。

我们可以使用Python中的自然语言处理(NLP)工具来分析和理解问题。利用nlp的提取特征的方法解决的具体过程:


使用NLTK库中的停用词列表来去除停用词

对每个单词进行分词,并去除停用词

提取困难模式下猜测的单词

计算每个单词的长度、不同字母的数量和元音字母的数量

统计困难模式下猜测的单词中出现的不同字母的数量、平均长度和元音字母的数量

打印数据摘要,包括每个数值变量的均值、标准差、最小值、25%、50%、75%和最大值


import torch

import torch.nn as nn

import torch.optim as optim


# Define the NLP model

class NLPModel(nn.Module):

    def __init__(self, input_size, hidden_size, num_classes):

        super(NLPModel, self).__init__()

        self.embedding = nn.Embedding(input_size, hidden_size)

        self.lstm = nn.LSTM(hidden_size, hidden_size, num_layers=2, batch_first=True)

        self.fc = nn.Linear(hidden_size, num_classes)


    def forward(self, x):

        x = self.embedding(x)

        out, _ = self.lstm(x)

        out = self.fc(out[:, -1, :])

        return out


# Define the hyperparameters

input_size = 1000 # Vocabulary size

hidden_size = 256 # Size of the hidden layer

num_classes = 2 # Number of output classes


# Create an instance of the model

model = NLPModel(input_size, hidden_size, num_classes)


# Define the loss function and optimizer

criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001)




更多的详见23美赛(C题)数学建模完整代码+建模过程全解全析(王牌) (mbd.pub)

呀感谢大家的支持

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,366评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,521评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,689评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,925评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,942评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,727评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,447评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,349评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,820评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,990评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,127评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,812评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,471评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,017评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,142评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,388评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,066评论 2 355

推荐阅读更多精彩内容