W1和W2两个模型,尽管截然不同,但会得到相同的运算结果。W1很容易出现过拟合的问题。 为了解决这个问题,加入一个用来惩罚权重参数的正则化惩罚项。 惩罚过后,w2的损失函数明显小于w1,说明w2模型的效果更好。