登录注册写文章

# L1正则化为什么比L2更容易获得稀疏矩阵

# L1正则化为什么比L2更容易获得稀疏矩阵

本文转载自王赟maigo 在知乎的回答，若有侵权，联系删除。
原文链接
假设费用函数 L 与某个参数 x 的关系如图所示：

image

则最优的 x 在绿点处，x 非零。
现在施加 L2 regularization，新的费用函数（ $L+Cx^2$ ）如图中蓝线所示：

image

最优的 x 在黄点处，x 的绝对值减小了，但依然非零。
而如果施加 L1 regularization，则新的费用函数（ $L+C|x|$ ）如图中粉线所示：

image

最优的 x 就变成了 0。这里利用的就是绝对值函数的尖峰。
两种 regularization 能不能把最优的 x 变成 0，取决于原先的费用函数在 0 点处的导数。
如果本来导数不为 0，那么施加 L2 regularization 后导数依然不为 0，最优的 x 也不会变成 0。
而施加 L1 regularization 时，只要 regularization 项的系数 C 大于原先费用函数在 0 点处的导数的绝对值，x = 0 就会变成一个极小值点。
上面只分析了一个参数 x。事实上 L1 regularization 会使得许多参数的最优值变成 0，这样模型就稀疏了。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Regularization(正则化，L0，L1，L2)----防止神经网络的过拟合2018-...
正则化的目的是稀疏神经网络中的权值，通过一些限制条件，训练使其中的一些不重要的权重为0，从而达到稀疏的目标，并且可...
晨曦日月阅读 3,046评论 0赞 1
回归系列之L1和L2正则化
机器学习监督算法的基本思路是让拟合的模型尽量接近真实数据，换句更通俗的话, 要让我们的模型尽量简单又能很好的反...
wujustin阅读 26,468评论 2赞 33
机器学习中的L0、L1、L2正则化
过拟合过拟合问题在机器学习中是一个经常遇到的问题，所谓过拟合，即模型过度地拟合了训练数据，从而导致模型在训练数据...
Jarkata阅读 3,307评论 0赞 1
正则化项L1和L2的直观理解及L1不可导处理
正则化（Regularization）机器学习中几乎都可以看到损失函数后面会添加一个额外项，常用的额外项一般有两...
MiracleJQ阅读 7,518评论 0赞 8
机器学习：L1与L2正则化项
题目关于支持向量机SVM,下列说法错误的是（） A. L2正则项，作用是最大化分类间隔，使得分类器拥有更强的泛化...
fancy_gogo阅读 1,098评论 0赞 0

赞1赞

赞赏

手机看全文