在数据处理中,经常遇到寻求回归方程的问题,即根据一组实验数据,建立两个或多个物理量(舒称因素)之间的在统计意义上的依赖关系式。
引言
最小二乘模型可以解决两类实际问题。
第一类问题:在数据处理中经常遇到寻求回归方程的问题,即根据一组实验数据建立两个或多个物理量(俗称因素)之间的在统计意义上的依赖关系式。例如一个量与另一个或几个量有关系。这类问题的一般性描述如下。假定要建立量与个量之间的依赖关系式,设方程为:
其中的形式事先给定,是待定参数。有组实验数据:
其中是试验中的已知数据,而是实验后得到的结果。 问题是,如何确定个参数从而建立起回归方程。把第个实验点的自变量 代入到其中就会得到相应的函数值。
是真实值的假设值。当然希望它们之差的绝对的假设值。当然希望它们之差的绝对
是非常自然的事情。这就是最小二乘模型。令
则最小二乘模型变为
令,则又变成
求它的最优解即称为求解最小二乘问题,将最优解代入到中所得即为回归方程。显然最小二乘问题是无约束规划,但由于其特殊结构,有其特殊的求解方法。
当所有的均是的线性函数时,称为线性最小二乘问题,否则,称为非线性最小二乘问题。
第二类问题:求解方程组(数学问题)
如是线性方程组,则为,当时,无解,但确实需要求解它。《线性代数》无办法。如是非线性方程组,在数学上求迭代解也非常麻烦,为此求解
是非常自然的事情。它也是一个最小二乘问题。
最小二乘问题的解法
(1) 线性最小二乘问题
当取线性函数形式,即,,则线性最小二乘问题为。其极小点的解有以下充要条件:。
(2) 非线性最小二乘问题
假定选定初始点 后,经过 次迭代已求得 。现在考虑 的求法。与Newton法的基本思想相类似,把 线性化,用线性最小二乘问题的解去逼近非线性最小二乘问题的解。具体做法如下。
把的第个分量在点处作Taylor级数展开,即
即有
令,
则上式可写成矩阵-向量形式
称是向量值函数在点处的Jacobi矩阵。从而求解:
将它的最优解作为下一个迭代点。显然
是线性最小二乘问题,可由上一段方法求解。因此必满足方程
如果是可逆的,则:
这相当于搜索方向为步长为1的过程。
称它为非线性最小二乘问题的Gauss-Newton迭代公式,而由这个公式所产生的算法称为Gauss-Newton法。当满足一定的条件,并且充分靠近极小点时,Gauss-Newton法是收敛的。
需要指出的是,即使在每次迭代中都是可逆的,也保证不了算法是下降算法。特别是当初始点远离极小点时,算法很可能发散。但是,当可逆时,所确定的是目标函数在点处的下降方向。
我的微信公众号名称:深度学习与先进智能决策
微信公众号ID:MultiAgent1024
公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!