几种信息熵的理解

本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。

    之前对算法原理和推导写的比较多,评价指标、信息熵较少,补充下。

    机器学习算法中经常会用到各种熵,如决策树、损失函数等,常见的熵包含信息熵、相对熵、条件熵、联合熵以及交叉熵,它们之间存在一些关系,刚开看的时候一头雾水,趁有点头绪,记录下。

    多样性是推荐系统用户体验的一个比较重要的评价指标,对于多样性指标,网上常常提及通过计算物品内容之间的相似度来判断,但由于我的项目要短时间内上线,没有太多时间计算物品之间的相似度。考虑能不能通过统计物品类目来初步判断其多样性,初步方案是简单统计推荐类目数量在总类目数量的占比,但这种方式粒度太粗,不能细致的描述类目分布。

    有没有其他方法可以更为细致描述类目分布多样性呢?信息熵不正可用于描述数据分布的不确定程度吗。信息熵的计算公式如下:

    例如:

        以下现有2种推荐列表结果,共9个商品,哪种类目分布不确定程度更高?

        (1)1(苹果),1(帽子),5(手机),2(围巾)

        (2)2(苹果),2(帽子),3(手机),2(围巾)

        从直观上,第2种类目的数量分布更为均衡,显然多样性更丰富。如下图,我们通过计算信息熵,结果显示第2种类目分布的信息熵略大于第1种,不确定性更高,多样性更丰富,符合预期。如采用统计类目占比,假定总类目数量为10,两种推荐列表的占比均为4/10,不能直观地显示它们之间的差异。

    其他一些熵(相对熵、交叉熵等)还可用于描述两种不同概率分布p(x)、q(x)之间的关系。

一、相对熵

二、条件熵

三、联合熵

四、交叉熵

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 本文的目录组织如下: 【1】自信息 【2】熵(香农熵) 【3】联合熵 【4】条件熵 【5】互信息(信息增益) 【6...
    城市中迷途小书童阅读 5,831评论 0 1
  • 本文的目录组织如下: 【1】自信息【2】熵(香农熵)【3】联合熵【4】条件熵【5】互信息(信息增益)【6】 熵、联...
    牛奶芝麻阅读 8,254评论 0 7
  • 熵通常被认为描述一个系统或者分布的不确定性,熵越大,系统越混乱,不确定性越大。机器学习与数据挖掘的算法中大量的应用...
    sylvainwang阅读 9,884评论 0 50
  • 主要参考机器学习笔记十:各种熵总结 一、什么是熵 熵定义:随机变量的概率分布对应的 **信息量的平均值 ** 就叫...
    小碧小琳阅读 10,690评论 0 5
  • 请听题:什么是熵?什么是交叉熵?什么是联合熵?什么是条件熵?什么是相对熵?它们的联系与区别是什么? 如果你感到回答...
    工程师milter阅读 14,145评论 5 57