一. 曲线插值和拟合
数模比赛中,常常需要根据已知的函数点进行数据、模型的处理和分析,而有时候现有的数据是极少的,不足以支撑分析的进行,这时就需要使用一些数学的方法,“模拟产生”一些新的但又比较靠谱的值来满足需求,这就是插值的作用。
一维插值
对表格给出的函数,求出没有给出的函数
y = interp1(x0,y0,x,"method")
# 分段线性插值,1是指一维
y = spline(x0,y0,x)
# 三次样条插值
% x0,y0是已知节点的坐标,同维向量; y对应于x处的插值,同维向量
% method["nearest"(最近邻),"linear","spline","cubic"(三次多项式插值) ]
- 将每两个相邻的节点用直线连接起来,如此形成的一条折线就是分段线性插值函数。每一个小段都确定一个函数表达式,叠加起来作为最终的表达式。
不进行分段时,插值点越多,最终函数的次数越高,而高次多项式会在插值的区间内发生严重的震荡现象——“龙格现象”。因此更倾向于使用分段低次多项式来近似原函数。
x = 0:2*pi; %生成[0,2*pi]之间的整数值
y = sin(x); %生成相应的函数值
plot(x,y,"or");%绘制一下点
xx = 0:0.01:2*pi;%这个是查询点的坐标向量
yy = interp1(x,y,xx,'linear'); %yy就是查询点向量对应的函数值向量了
plot(x,y,"o",xx,yy,"r");
xx=1.23;%只查询一个元素也是可以的
yy = interp1(x,y,xx,'linear');
plot(x,y,"o",xx,yy,"r");
-
分段三次Hermite(埃尔米特)插值
不仅要求插值函数过相应的已知点,还要求函数曲线在已知点处一阶导数值等于原函数的导数值,这也是为什么三次埃尔米特在已知点处更为平滑,且与原曲线更为相近。
使用三次多项式作为每一个小段的插值多项式,相对于线性函数,三次多项式更为平滑。
p = pchip(x,y,newx) %在MATLAB中至少需要4个点
interp1(x,y,xx,'pchip')
分段三次Hermite 三次样条插值
所谓样条曲线,就是把一根具有弹性的细长木条(样条)在几个样点处用压铁压住,其余位置自由弯曲。这样子,由样条形成的曲线就称之为样条曲线。样条曲线实际上是由分段三次曲线连接而成,且在连接点处具有连续的二阶导数,从数学上加以概括就得到三次样条的概念。
以上这些等式条件,提供了4n-2个方程,但如果我们需要4n个三次多项式,就需要解出4n个未知数,也就是需要4n个方程。剩下的两个方程,我们称之为边界条件。
如果存在边界条件,则我们使用csape
函数进行三次样条插值。
pp = csape(x,y)
可以看到,三次样条插值最接近原曲线,分段线性插值与原曲线相差最远。在实际使用中,三次样条插值函数也比较多。
此外,还有n维数据插值,使用到的函数是interpn
temps = [82,81,80,82,84;79,63,61,65,87;84,84,82,85,86];
mesh(temps) % 根据原始数据绘出温度分布图,可看此图粗糙度
width = 1:5;depth = 1:3;
di = 1:0.2:3;wi = 1:0.2:5;
[WI,DI] = meshgrid(wi,di); %增加了节点数目
ZI = interp2(width,depth,temps,WI,DI,"cubic"); %三阶插值
surfc(WI,DI,ZI)
问题
:(1)给出估计任意时刻的排沙量及总排沙量的方法(2)确定排沙量与水流量的关系
视频讲解
`思路':排沙量 = 水流量×含沙量
已知给定观测时刻是等间距的,那么各次观测时刻(离开始时刻6月29日零时)分别为`t = 3600(12i - 4),i = 1,2,...,24
记第i次观测时水流量为vi,含沙量为ci,则含沙量yi = vi×ci
考虑到实际中的排沙量应该是时间的连续函数,为提高模型精度,采用三次样条函数进行插值。
求出y = y(t)与时间的关系,进行积分,就可以得到总的排沙量
对于问题(2),研究排沙量与水流量的关系,从试验数据可以看出,开始排沙量是随着水流量的增加而增长,而后是随着水流量的减少而减少。显然,变化规律并非是线性的关系,为此,把问题分为两部分,从开始水流量增加到最大值 2720m/s(即增长的过程)为第一阶段,从水流量的最大值到结束为第二阶段,分别来研究水流量与排沙量的关系。
曲线拟合
拟合类似于插值,都是函数逼近的一种手段。区别在于,插值函数必须经过所有已知点,而拟合得到的函数,只需要满足在某种意义下,已知点与该函数曲线的“误差”最小。
也就是说,拟合是在平面上找到一条连续的曲线,使得所有已知点到这条曲线的总距离最小。这样我们就有理由使用这条曲线来近似原函数曲线了。
-
一元线性拟合
找到一条直线y= kx+b
使得所有的已知点与该直线的总距离最小,也就是总偏差最小。
衡量标准——最小二乘法
公众号:我是陈小白 非线性函数的线性化
因此在函数拟合前一定要先进行作图(散点图)
从散点图可以看出,第一阶段基本上是线性关系。第一阶段和第二阶段都准备用一次和二次曲线来拟合,哪一个模型的剩余标准差小就选取哪一个模型。
最终结果
% 一: y=250.5655v-373384.4661
% 二: y=0.167v*2-180.4668v+72421.0982
其他解法: 黄河小浪底调水调沙灰色数学研究
- 评价拟合效果
y_hat = k*x+b; % y的拟合值
SSR = sum((y_hat-mean(y)).^2) % 回归平方和
SSE = sum((y_hat-y).^2) % 误差平方和
SST = sum((y-mean(y)).^2) % 总体平方和
SST-SSE-SSR % 5.6843e-14 = 5.6843*10^-14 matlab浮点数计算的一个误差
R_2 = SSR / SST
- matlab拟合工具箱
Curve Fitting
在命令行输出“cftool”
界面
拟合也存在着一个典型的问题,即过拟合现象。如果你的参数个数要比变量的个数还要多,那么在具体拟合的时候,很可能会得到很小的SSE。单从拟合的角度而言是没问题的,但是这种过拟合,可能无法合理地解释实际问题,因此在拟合的时候需要注意过拟合的问题。其实插值,例如拉格朗日插值这种可以得到一个单一函数的插值方法,我们就可以将它理解为过拟合。虽然它的SSE=0,已经达到了最好,但无论是用来预测未来,还是用来解释现象,插值函数都不是一个很好的选择。
2. 数值积分
3. 优化问题
线性规划有约束极小问题
非线性规划有约束极小问题
非线性无约束极小问题
非线性最小二乘问题
二次规划