信息熵的前世今生

1. 熵的由来

熵最早出现于热力学中,是衡量分子混乱程度的物理量。它表明宇宙中一切事物的总趋势都朝着混乱无序的状态发展,且是不可逆的。

2. 信息熵

1948年信息论之父香农将熵引入到了信息论之中,信息从此能被量化,信息熵正式登场。

信息熵既是对不确定性的度量,也是对信息量的度量。

试想,事物的不确定性很大,我们对它了解很少甚至一无所知,那么当我们从“一无所知”变为“胸有成竹”时,我们一定得到了有关它的大量信息,即不确定性 \Uparrow(越大) ,则传递信息量\Uparrow(越大)。当然也可认为不确定性\Uparrow事物本身信息量\Downarrow。为方便记忆,一般我们取前者。

2.1 为什么信息熵公式长这样?

定义信息熵符号为E (entropy),随机变量为X,则
E(X)=-\sum_{x}{p(x)\log{p(x)}}

假定我们不知道信息熵的公式,想从信息熵的性质出发来推断E(x)到底是个什么样的函数形式。但在此之前,我们不妨先忘掉信息熵,只关注信息量(又称为自信息,self \quad information)。本文用I(x)表示随机事件x发生时传递的信息量。

由前文可知,信息量与不确定性的关系应为单调递增单调递减(人为定义),所以I(x)应该能由随机变量X的概率分布p(x)表示,这里的xX中的某个随机事件,或者说取值。
I(x)=f(p(x))

我们想从信息量的性质出发得到一个度量信息量的公式,那么它应该具有如下性质:

  1. 有两个独立随机事件x,y,则x,y同时发生所包含的信息量应该等于x,y单独发生时所包含的信息量之和。
  2. 不确定性越大,信息量越大。 (人为定义)
  3. 信息量大于0。 (人为定义)

由性质1可得:I(x,y)=I(x)+I(y)

又因为p(x,y)=p(x)p(y)

所以f(p(x)p(y))=f(p(x))+f(p(y))
看到这里,我们应该能想到I(x)中包含对数形式,不妨设
I(x)=q(x)\log_{2}{p(x)}

其中q(x)是未知函数。性质中不知底数大小,但可知单调递增,因此假设为2。为求简洁,之后公式中省略底数。

按上述公式展开,得
I(xy)=q(xy)\log{(p(x)p(y))}=q(x)\log{p(x)}+q(y)\log{p(y)}

要使上述等式对任意独立的随机事件x,y都成立,只能是
q(x)=q(y)=q(xy)

因此q(x)=\alpha 阿尔法为任意常数。

由此我们得到了信息量的表达式
I(x)=\alpha\log_{2}{p(x)}

再结合性质3,可知\alpha<0,并且这个系数对我们度量信息量并无太大影响,因为所有的随机事件度量信息量时都要乘上这个系数,"一视同仁"。那么就设为最简单的-1吧。底数大小同理。

有了信息量的公式,我们发现它是随机事件发生概率的对数值。假设有一个随机变量X,它包含了很多个随机事件,我们想知道这个随机变量带给了我们多少信息量,但我们事先不知道这个随机变量的值是多少,只能预先估计,对随机变量所有事件都按概率取值并计算信息量,也就是X的信息量期望,它也被称呼为信息熵

至此我们得到了信息熵的表达式,它是对随机变量不确定性的度量,是对所有可能发生的随机事件的期望。

E(X)=-\sum_{x}{p(x)\log{p(x)}}

从公式可知,随机变量的取值个数越多,状态数也就越多,信息熵就越大,混乱程度就越大。当随机分布为均匀分布时,熵最大。信息熵只与随机变量的分布有关,与其值无关。

2.2 联合熵

上述是一元随机变量,我们把它推广到多元随机变量
E(X,Y)=-\sum_{x,y}p(x,y)\log{p(x,y)}

2.3 条件熵

在条件分布的基础上,来定义条件熵,已知随机变量X取了某个值m,那么随机变量Ym条件下的熵就是
E(Y\mid X=m)=-\sum_{y}p(y\mid m)\log{p(y\mid m)}

现在不知道随机变量X取了什么值,需要预先估计Y的熵对X的期望,因此
E(Y \mid X)=-\sum_{x}p(x)\sum_{y}p(y\mid x)\log{p(y\mid x)}

通俗来说,如果X,Y同时取某两个事先不知道的值,那么它的信息熵(平均信息量)有E(X,Y)这么多,而X单独取值时它的信息熵(平均信息量)是E(X),自然E(X,Y)-E(X)就是Y在已知X的条件下的平均信息量。

注意,上述X,Y并没有假设为相互独立,我们前面假设的是随机事件x,y相互独立,针对的是信息量(self\; information),二者并不矛盾。进一步,如果假设X,Y独立,则E(X,Y)-E(X)=E(Y)

3.结语

将熵引用到信息论中是一个影响深远的决策。下篇文章我们将看到诸多以熵为基础的公式、模型发挥真正威力,see\; you \;then~

参考

信息熵

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352