无标题xdasd文章

#一、简单介绍

按照信息论基本原理的解释，信息是系统有序程度的一个度量，熵是系统无序程度的一个度量；如果指标的信息熵越小，该指标提供的信息量越大，在综合评价中所起作用理当越大，权重就应该越高。

#二、计算方法

##(一)归一化

假设原式数据$X$为一个n*p维矩阵（n个样本，p个变量）$\begin{pmatrix}x_{11}&x_{12}&\cdots&x_{1p}\\\vdots\\x_{n1}&x_{n2}&{\cdots}&x_{np}\end{pmatrix}$

则对每一个变量的取值，也就是每一列进行归一化处理得Y。对于归一化处理后的每一列$y_{\cdotj}$$y_{ij}=\frac{x_{ij}-min\{x_{\cdotj}\}}{max\{x_{\cdotj}\}-min\{x_{\cdotj}\}}$

##(二)求各变量的信息熵

对于变量j，其信息熵$H_j = E(-ln\p_{ij})=-\sum_{i=1}^{n}p_{i j}\cdotln\p_{ij}$其中$p_{ij}=\frac{y_{ij}}{\sum_{i=1}^{n}y_{ij}}$如果$p_{ij}= 0$,则定义$\lim_{p_{ij}\to0}p_{i j}\cdotln\p_{ij}= 0$

##(三)根据信息熵求各变量权重

上面可以计算出p个变量的信息熵：$H_1,H_2,\cdots,H_p$则第j个变量的权重:

$w_j =\frac{1-H_j}{p -\sum_{j=1}^{p}H_j},j\in\{1,2,\cdots,p\}$

最后编辑于：2017.12.08 05:38:25

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

无标题xdasd文章

无标题xdasd文章

#一、简单介绍

相关阅读更多精彩内容

友情链接更多精彩内容