最简单的方法就是:标准化方法
还有【重新缩放法】,出自:http://www.nohup.cc/article/166/#menu_index_2
在文章中,提到标准化的方法为:
标准化方法有一个好处:python里面的numpy包中有求矩阵均值,标准差等统计参数的函数,很方便。
其中,x,x¯,σ,x′ 分别表示原矩阵中需要归一化的输入数据,原矩阵数据的均值,原矩阵数据的标准差,归一化后的输出数据。
在python中利用 numpy,实现。
假设,样本含有n个因素,共有m个样本,即可以组成 m*n,矩阵。
归一化如下:
def Normalization(self):
self.martix = open_the_file() #打开数据文件函数
u = np.mean(self.martix, axis=0) # axis=0,计算每一列的均值
v = np.std(self.martix, axis=0) # axis=0计算每一列的标准差
for j in range(self.M):
for i in range(self.N):
self.martix[j][i] = (self.martix[j][i] - u[i]) / v[i]
————————————————————————————————————
吐槽一下,简书没有公式编辑器,真的难受。
最后一篇文章了,转到CSDN去了。