练习一
用mas5方法计算每个探针的表达是否是真实的,可以用mas5calss()
实现,结 果中P
,M
,A
分别表示present(表达),margina,absent(未表达),请将至少在一个样本中表 达的探针提取出来,并写入本地result文件夹中(要求:提交代码和文件)
mas5calls <- mas5calls(raw)
exp.mas5calls <- exprs(mas5calls)
AP <- apply(exp.mas5calls , 1, function(x)any(x=="P"))
exp.mas5calls.filted <- exp.mas5calls[AP,]
write.table(exp.mas5calls.filted,"exp.mas5calls.filted.txt")
参考→ 芯片数据分析步骤5 过滤探针
练习二
请基于样本间pearson相关系数,补齐下述代码,给样本聚类: (要求:提交代码和图文件)
pearson_cor=cor(exp.rma) ###两两样本间的pearson 相关系数
dist.lower=as.dist(1-pearson_cor) ###计算距离矩阵
H <- hclust(dist.lower)
plot(H,cex=0.5); #不然太大了有点
cutree(H,2)
参考→ R 聚类分析
limma包的贝叶斯检验原理
贝叶斯所要解决的问题就是在有条件限制的情况下,求取某一事件发生的概率。
例如你去理发店理发,有可能是发型总监给你服务,也有可能是新来的实习生给你服务。发型总监给你服务,你的满意度为99%,实习生给你服务,你的满意度可能只有90%。假定你是第一次去这家理发店且随机指定了一个人给你服务,结果你很满意,那么求发型总监给你服务的概率或者实习生给你服务的概率这个问题就属于贝叶斯分类问题。
条件概率
条件概率通常记为P(B/A),表示在事件A发生的情况下,事件B发生的概率。
上即为事件A发生的条件下事件B发生的概率。设试验的基本事件总数为n,事件A包含的所有情况数量为m(m>0),事件AB包含的情况数量为s,则有
条件概率P( · |A)符合概率定义的三个条件:
- 非负性 对于每个事件B,有P(B|A) >= 0
- 规范性 对于必然事件S,有P(S|A)= 1;
- 可列可加 设B1,B2,..是两两互斥 →朴素贝叶斯