上一篇文章介绍了期望的计算公式:
其中,为每一个数据元素数值,而是这个值的出现概率。期望值,即一个数组的总体平均值,描述这组数据的中心趋势。在实际应用中,我们不单要知道一组原始数据的期望值,而且要知道这组数据线性变换后的期望值。
那什么是线性变换呢?简单地说,就是一个数值x,可以乘任意系数k,在加上一个任意常数c后的数值y。说得专业一点,y是x的一个线性函数或线性映射。
什么时候需要用到这样的变换呢?比如一件家具的生产出来后,成本价为x。经过流通环节,到达销售终端时,价格可能变成成本价的k倍,并加上c元。这就是一个线性变换。
现在我们的问题是,如果一家工厂生产了n种家具,每一件的成本价为。那么,经过同样的流通后,也就是同样的线性变换后,最终售价的平均值,是否能用成本价的均值来推断呢,或者说,我们能否说
直觉上,这是可以的。很多书本或文章节选,都会直接给出这个式子,但是基本不作详细证明,直接来一句“显而易见”了事。我感觉这是不足够的。曾经看过某个数学家说过这么一句话,我深以为然。
One can't apply a theorem confidently without knowing its validity.
于是,我打算对下面关于期望的三个变换作推导。
三个变换推论分别是:
1.
2.
3.
第一种变换的证明:
证毕
第二种变换的证明:
证毕
第三种变换的证明:
有了前两个推论证明,第三个变换已经显而易见。
证毕
最后提一句,关于期望和方差的各种推导,我还是喜欢回到最原始的各个数字相加后取平均的写法,因为我发现很多关于这个话题的证明,都直接使用连加符号(Sigma notation),初学者通常不适应。因此,这系列的文章的证明过程或许会“丑”一点。