在这个大数据时代,大量的信息迎面而来,让我们在接受信息时变得手足无措,因此如何选择有效信息进而规避无用信息就显得尤为重要。这就要求我们要了解“信息论”中的“互信息”。因为它可以衡量两个事物的相关性,对寻找强相关性的联系起到了至关重要的作用。
在互信息中,一个比较有趣的例子是“裙摆指数”这个指数的含义是指,女人裙子的长短和股票的涨跌有着强相关性,女人穿的裙子短,则股票涨,女人穿的裙子长,则股票跌,但有些人认为这个因果关系有问题,是由于股票涨了,导致男人有心情和女人约会,所以女人穿的裙子短,然而将这两个事件带入互信息的公式里就会发现,根本无法证明两者的强相关性。对于这方面还有一个例子就是:普遍都说乌鸦不吉利,有乌鸦的地方会死人,其实不是因为乌鸦飞导致的人死,而是因为有人死了,乌鸦闻到了尸体腐烂的味道才飞来的,因果关系颠倒了。
因此,我们要关注强相关性事物之间的联系,而忽略弱相关性事物之间的联系,同时需要注意强相关性事物的因果关系不要颠倒。否则会出现意想不到的事情,就好像大家都知道比尔盖茨和扎克伯格表面上看大学没毕业就辍学了,成功的开办了公司。但其实是人家创业成功后才辍学的。
互信息高=强相关性
以下是互信息公式:
无论事物之间的相关性如何,高学历与高收入之间确实是强相关的,所以,让我们一起终身学习吧!