协方差矩阵python实现

    当你有一个数据集,每一条数据都M种属性,然后你想知道M种属性对数据集的影响的时候。你需要用到协方差矩阵。

    求协方差矩阵之前请一定要知道协方差矩阵是干嘛的,是表示属性之间关系的矩阵,协方差矩阵的规模只与属性数量有关,和数据总量无关。blog.sciencenet.cn/blog-455004-805926.html 这里讲的很清楚。

python代码如下:

class PCA:

def avg(self,data):

avgData = [0]*len(data[0])

for i in range(0,len(data)):

for t in range(0,len(data[i])):

avgData[t] += data[i][t]

for i in range(0,len(avgData)):

avgData[i] = float(avgData[i])/len(data)

return avgData

def getCovMatrix(self,data,avg):

covData = [[0 for i in range(len(data[0]))] for i in range(len(data[0]))]

for i in range(0,len(data[0])):

for t in range(0,len(data[0])):

covData[i][t] = self.getCov(data,i,t,avg)

return covData

def getCov(self,data,col1,col2,avg):

cov = 0;

for i in range(0,len(data)):

cov += (data[i][col1]-avg[col1])*(data[i][col2]-avg[col2])

#print cov/(len(data)-1)

return cov/(len(data)-1)

data = [[-1,-1,1],[-2,-1,4],[-3,-2,-2],[1,1,1],[2,1,2],[3,2,1],[1,2,4]]

example = PCA()

avgdata = example.avg(data)

print example.getCovMatrix(data,avgdata)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容