1.熵的定义
我们把熵代表一个系统中的不确定性,其基本公式如下:
如果x是一个连续的取值,那么还有另外一种表示形式如下:
总结:
- 可以看得出来熵是一个正数即>=0,这也正好可以表示不确定性或者说是发散的程度,确定的事件不发散所以其熵为0.
2. KL散度,相对熵的定义,其表示两个分布X和Y不同的程度
其基本公式可以表示为如下:
总结:
- KL散度不能确定正负数,毕竟两者之间的差异可以是正的也可以是负的。
- 由上面的公式可以看的出来,X||Y的相对熵计算依赖于
所以和Y||X是不对称的
3. 交叉熵:
对于交叉熵,可以用如下的公式进行计算