

Wf和Wt内积越来越大,说明两向量越来越接近,Wt更新后会越接近目标值Wf。

Wt慢慢长,说明内积越来越大,不完全是长度变大,而是越来越靠近,两向量夹角在减小。

又因为两个正规化向量的内积最大为1。

下面给出证明:

有问题的地方是中间怎么Wf^T.Wt-1怎么变成W0

PLA优缺点:
优点:易执行,快,可以工作在任意维度的数据。
缺点:需要提前知道数据是否线性可分,不能确定何时能停下来。
改进或者另一个替换算法,可用在未知数据是否线性可分的情况下使用,Pocket算法。
这是一种贪心算法,每当更新W值时,检查所有点,记录错误数目,总是把错误最少的那个W存起来,代价就是,如果数据线性可分,运行时间会比PLA长很多。
引用:其他人博客上笔记