主成分分析PCA
数据降维:将二维数据变为一维,也就是在原来的数据所形成图像中重新找一个坐标系,是的各数据点都落在新坐标轴的一条轴线上,数据损失最小
新坐标系:
实现PCA
首先要去中心化(把坐标原点放在数据中心),再找坐标系(找到方差最大的方向)
1.明白数据线性变换
*拉伸
*旋转
白数据--拉伸--旋转--新数据
2.PCA本质求R,协方差矩阵特征向量为R
协方差
协方差矩阵
根据协方差矩阵求特征向量,特征值构成PCA主成分
特征向量是R,也就是旋转方向,即坐标轴方向
特征值坐标轴方向上数据的方差
PCA与置信椭圆**
PCA缺点
1.离群点影响大
主成分分析及其应用
起源1.寻找重要因素
起源2.综合评价时要求指标同向且线性无关或不相关
起源3。建立回归模型的需要
分析步骤
1.原始向量组标准化:原始值减去每一列均值再除以标准差
2.将主成分Z写为变量集合的等式
3计算特征值和正交向量
4.确定主成分个数
5.建立相应主成分方程
应用:
灰色系统模型
只能依据某种思维逻辑与推断来构造模型。对这类部分信息已知而部分信息未知的系统,我们称之为灰色系统。
分析方法--关联度分析
根据因素之间的发展态势的相似或相异程度来衡量因素间关联程度
——揭示事物动态关联特征与程度
灰色预测步骤GM(1,1
1,级比生成——判断原始数据关联程度
2.灰色生成方式:累加生成(必要时进行移轴)、累减生成、均值生成
3.精度检验
SARS的传播+长江水质评价与预测
灰色预测的四种常见类型
- 数列预测: 用观察到的反映预测对象特征的时间序列来构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。
- 拓扑预测: 原始数据作曲线,在曲线上按定值寻找该定值发生的所有时点,并以该定值为框架构成时点数列,然后建立模型预测该定值所发生的时点。
- 系统预测: 通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化。
-
灾变与异常值预测: 通过灰色模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。
【【【数模赛前突击】灰色预测模型(数学建模零基础入门)】 https://www.bilibili.com/video/BV1Zy4y1G73E/?share_source=copy_web&vd_source=8585f995748dfbc0dce48de78482ec20】