登录注册写文章

00003. 参数化多项式分布时，为什么使用k-1个参数？

00003. 参数化多项式分布时，为什么使用k-1个参数？

多项式分布

我们知道，对于有 $\small{k}$ 个不同可能目标变量取值的学习问题，使用多项式分布(multinominal distribution)来建模。但是为什么参数化多项式分布时，为什么不选择 $\small{k}$ 个参数，而是 $\small{k-1}$ 个参数呢？

正则化公理

我们所选择的 $\small{k-1}$ 参数的含义是对应各自输出值的概率大小。这样一来，最后一个输出值的概率可以由正则性公理得到 $\small{\phi_{i}=p(y=i;\vec{\phi}), i=1,\cdots,k-1}$ $\small{\phi_{k}=p(y=k;\vec{\phi})=1-\sum_{i=1}^{k-1}\phi_{i}}$ 因此只有 $\small{k-1}$ 个参数是相互独立的。

延伸

一个类似但不同的问题是，为什么总体方差的无偏估计的系数是 $\small{\frac{1}{n-1}}$ 而非 $\small{\frac{1}{n}}$ ? 知乎有对这个问题专门的讨论。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

多项式回归与模型泛化
之前总结的线性回归都是在特征集每个特征项数为1的情况下进行求解，即y=θ0 * X0 + θ1 * X1 + .....
Chuck_Hu阅读 3,278评论 2赞 4
Batch Normalization论文翻译——中英文对照
文章作者：Tyan博客：noahsnail.com | CSDN | 简书声明：作者翻译论文仅为学习，如有侵权请...
SnailTyan阅读 5,178评论 0赞 8
朴素贝叶斯以及三种常见模型推导
朴素贝叶斯在机器学习中，朴素贝叶斯分类器是一系列以假设特征之间强（朴素）独立下运用贝叶斯定理为基础的简单概率分类...
七八音阅读 20,836评论 0赞 21
类加载概念
提到类加载的概念，很多朋友可能会问，什么是类加载？类加载了解后对我们的测试开发工作有什么帮助？在此，我们想先集中整...
烨枫_邱阅读 732评论 1赞 3
时间，只有时间，是公平的
时间是最公平，对每个人都是公平的。最好的疗伤药也是时间。这个世上什么最强大?时间能让一切说真话!时间能揭开虚伪的...
不问忧伤阅读 1,431评论 0赞 9

3赞4赞

赞赏

手机看全文