数学建模系列笔记3:预测和相关分析

@[toc]

3-3-1 马尔科夫链模型

  • 马尔科夫性

    用来描述一种特殊的,定义在某状态空间S上的随机变量序列{Xn},它满足性质
    P(X_{n+1 = E_{n+1}}|X_1 = E_1,X_2 = E_2,…,X_n = E_n) = P(X_{n+1} = E_{n+1}|X_n=E_n)
    将来的状态只与现在有关,而与过去相互独立。

  • 马尔科夫链Markov Chain:是具有马尔科夫性的并且状态离散的随机过程。

    圆圈:状态

    箭头:可能的状态转换

    权值:状态转移概率,每一个状态只和它的前一步状态有关

  • 马尔科夫链模型

3-4-1 灰色预测模型

  • 灰色系统:部分信息已知,部分信息未知的“小样本,贫信息“的不确定性系统。通过对部分一直信息的生成、开发去了解、认识现实世界,实现对系统运行行为和演化规律的正确把握和描述。

  • 灰色系统做预测的序列需满足的条件“

    1. 数据量小,一般7-15个数据

    2. 数据的分布不详或不服从正态分布

    3. 数据具有指数趋势

    4. GM(1,1)模型

    灰色系统 grey model GM(1,1)模型是根据系统中已知的多种因素的综合数据,将此数据的时间序列按微分方程拟合去毕竟上述时间序列所描述的动态过程,进而向后推导,达到预测目的。

    这样拟合得到的模型是时间序列的一阶微分方程,因此简记为GM(1,1)模型。
    令 X^{(0)}为原始序列,\\ X^{(0)} = (x^{(0)}(1),x^{(0)}(2),…,x^{(0)}(n))\\ X^{(1)}为X^{(0)}的1-AGO序列\\ x^{(1)}(k) = \sum_{i=1}^k x^{(0)}(i),k = 1,2,…,n

    令 X^{(1)}为原始序列,\\ X^{(1)} = (x^{(1)}(1),x^{(1)}(2),…,x^{(1)}(n))\\ X^{(0)}为X^{(1)}的1-IAGO序列\\ x^{(0)}(k) = x^{(1)}(k)-x^{(1)}(k-1),规定x^{(1)}(0) = 0

    IAGO \quad X^{(1)} = IAGO(AGO \quad X^{(0)}) = X^{(0)}

    1. 建立GM(1,1)的微分方程模型

    z^{(1)}x^{(1)}的紧邻均值生成序列:
    z^{(1)}(k) = \frac{x^{(1)}(k)+x^{(1)}(k-1)}{2}\\ 则可建立GM(1,1)的微分方程模型为:\\ x^{(0)}(k)+az^{(1)}(k) = b

    1. 构造数据矩阵B,计算参数

    利用最小二乘估计,得\hat{\alpha} = (a,b)^T = (B^T B)^{-1} B^T Y_n

    1. 求解微分方程

      第二步建立的微分方程相应的白化方程为:
      \frac{dx^{(1)}}{dt}+ax^{(1)} = b\\ 解得:\hat{x}^{(1)}(k+1) = [x^{(0)}(1)-\frac{b}{a}]e^{-ak}+\frac{b}{a}

    2. 得到预测方程
      \hat{x}^{(0)}(k+1) = \hat{x}^{(1)}(k+1)-\hat{x}^{(1)}(k)

    3. GM(1,1)模型检验:残差检验和后验差检验

  • 拓展的GM模型

    1. 新陈代谢的GM模型

      思想:用最新的数据预测不远的未来

      方法:加一个新数据,同时去掉一个旧数据

    2. 残差修正的GM模型

      问题:若后五年数据预测与实际差距越来越大(指数趋势越来越不明显)

      方法:预测值 = 利用原始数据做出的GM模型的预测值 - 利用残差数据做出的GM模型的预测值

3-5-1 人工神经网络

人工神经网络:由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所做出的交互反应。

BP神经网络:反向传播BackPropagation网络,是一种多层前向网络,采用最小均方差学习方式。这是一种最广泛应用的网络,可以用作分类、聚类、预测等。

算法概括

  1. 对权系数w_{ij}直初值:对各层的权系数w_{ij}置一个较小的非零随机数
  2. 输入一个样本x = (x_1,x_2,…,x_n,1),以及对应期望输出y = (y_1,y_2,…,y_n)
  3. 计算各层的输出
  4. 求各层的学习误差
  5. 修正权系数w_{ij}和阈值
  6. 当求出了各层各个权系数之后,可按给定品质指标判别是否满足要求。如果满足要求,则算法结束;如果未满足要求,则返回“3”执行。

产生误差的可能原因:

  1. 存在异常点
  2. 网络结构问题:隐层个数选择,传递函数选取

4-1-1 关联分析

  • 皮尔逊相关系数

    1. 两变量的总体服从正态分布
    2. 样本容量较大
    3. 变量必须是成对数据
  • Spearman等级相关系数的适用条件

    1. 对变量总体分布、样本容量不作要求
    2. 变量必须是成对数据
    3. 适用有序数据

    r_{SP} = 1-\frac{6\sum_{i=1}^n d_i^2}{n(n^2-1)}

    其中n为样本量,di为两组数据的等级之差

  • kendall秩相关系数

    1. 同Speraman等级相关系数
    2. 适用有序分类变量
      r_K = \frac{2(N_c - N_d)}{n(n-1)}
      其中n为样本量,N_c为同向数对的数目,N_d为反向数对的数目

三种相关系数的异同点

  • 相同点:测量两变量的相关程度和变化方向,取值范围相同
  • 不同点:
    1. pearson相关系数适用于正态分布的总体,连续性数据的变量,度量变量之间线性相关程度,是参数统计方法
    2. Spearman与Kendall相关系数对样本容量、总体分布不作要求,是非参数统计方法
    3. Spearman适用于有序数据,Kendall适用分类数据

4-1-2 独立性检验

  • 分析按两个或多个特征分类的频数数据,这种数据称为交叉分类数据,一般以表格的形式给出,这种表格称为列联表RXC

  • 检验过程

    1. H_0:A,B独立 p_{ij} = p_i p_j,i=1,2,…,r,j = 1,2,…,c

      H_1:A,B之间有关系

    2. 检验统计量
      \chi^2 = \sum_{i=1}^r \sum_{j=1}^c \frac{(n_{ij}-n\hat{p}_{ij})^2}{n\hat{p}_{ij}}\sim \chi^2(r-1)(c-1)

    3. 给定显著性水平\alpha,做出统计决策

4-2-1 通径分析

4-3-1 典型相关分析

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容

  • 无总结反省则无进步 写这篇文章,一是为了总结之前为了准备美赛而学的算法,而是将算法罗列并有几句话解释方便以后自己需...
    Amazing_ez阅读 7,325评论 0 11
  • 典型相关分析 用于分析两组变量的相关性。 我们使用相关系数来衡量两个随机变量间的线性关系,而在统计两组变量之间的相...
    茶酒qqq阅读 4,147评论 0 1
  • 关键词:灰色预测、Python、pandas、numpy 一、前言   本文的目的是用Python和类对灰色预测进...
    crossous阅读 56,673评论 45 55
  • 一、预测与预报 1、灰色预测模型(必掌握) 满足条件可用:(1)数据样本点个数少,6-15个(2)数据呈指数或曲线...
    BettyChen_yolo阅读 753评论 0 0
  • 线性规划 线性规划问题 线性规划(Linear programming,简称LP)是运筹学中研究较早、发展较快、应...
    Roper_被注册阅读 2,809评论 2 8