无标题xdasd文章

#一、简单介绍

按照信息论基本原理的解释,信息是系统有序程度的一个度量,熵是系统无序程度的一个度量;如果指标的信息熵越小,该指标提供的信息量越大,在综合评价中所起作用理当越大,权重就应该越高。

#二、计算方法

##(一)归一化

假设原式数据$X$为一个n*p维矩阵(n个样本,p个变量)$\begin{pmatrix}x_{11}&x_{12}&\cdots&x_{1p}\\\vdots\\x_{n1}&x_{n2}&{\cdots}&x_{np}\end{pmatrix}$

则对每一个变量的取值,也就是每一列进行归一化处理得Y。对于归一化处理后的每一列$y_{\cdotj}$$y_{ij}=\frac{x_{ij}-min\{x_{\cdotj}\}}{max\{x_{\cdotj}\}-min\{x_{\cdotj}\}}$

##(二)求各变量的信息熵

对于变量j,其信息熵$H_j = E(-ln\p_{ij})=-\sum_{i=1}^{n}p_{i j}\cdotln\p_{ij}$其中$p_{ij}=\frac{y_{ij}}{\sum_{i=1}^{n}y_{ij}}$如果$p_{ij}= 0$,则定义$\lim_{p_{ij}\to0}p_{i j}\cdotln\p_{ij}= 0$

##(三)根据信息熵求各变量权重

上面可以计算出p个变量的信息熵:$H_1,H_2,\cdots,H_p$则第j个变量的权重:

$w_j =\frac{1-H_j}{p -\sum_{j=1}^{p}H_j},j\in\{1,2,\cdots,p\}$

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • # Basics ## Standard notations- Variable: $X$ (uppercase ...
    一只叫kevin的蓝精灵阅读 1,647评论 0 0
  • 以西瓜书为主线,以其他书籍作为参考进行补充,例如《统计学习方法》,《PRML》等 第一章 绪论 1.2 基本术语 ...
    danielAck阅读 4,665评论 0 6
  • 在C语言中,五种基本数据类型存储空间长度的排列顺序是: A)char B)char=int<=float C)ch...
    夏天再来阅读 3,425评论 0 2
  • 熵的相关概念,第一次在决策树那章做了简单介绍,但是要想正确理解熵的确实需要下一番功夫。这次,我们在最大熵模型这章继...
    559fb24f07f0阅读 5,371评论 2 11
  • 小狐狸开了一家酸奶店,小猪开了一家豆腐店,小兔开了一家油店。 小狐狸店里卖酸奶,如果当天没有卖完,它会撕下标签,贴...
    一抹茶清阅读 238评论 1 0