lab1_练习1, 2

练习一

mas5方法计算每个探针的表达是否是真实的,可以用mas5calss()实现,结 果中P,M,A分别表示present(表达),margina,absent(未表达),请将至少在一个样本中表 达的探针提取出来,并写入本地result文件夹中(要求:提交代码和文件)

  mas5calls <- mas5calls(raw)
  exp.mas5calls <- exprs(mas5calls)
  AP <- apply(exp.mas5calls , 1, function(x)any(x=="P"))
  exp.mas5calls.filted <- exp.mas5calls[AP,]
  write.table(exp.mas5calls.filted,"exp.mas5calls.filted.txt")
提取至少在一个样本中表达的探针

参考→ 芯片数据分析步骤5 过滤探针

练习二

请基于样本间pearson相关系数,补齐下述代码,给样本聚类: (要求:提交代码和图文件)

  pearson_cor=cor(exp.rma)  ###两两样本间的pearson 相关系数
  dist.lower=as.dist(1-pearson_cor)   ###计算距离矩阵
  H <- hclust(dist.lower)
  plot(H,cex=0.5); #不然太大了有点
  cutree(H,2)
聚类结果

参考→ R 聚类分析

limma包的贝叶斯检验原理

贝叶斯所要解决的问题就是在有条件限制的情况下,求取某一事件发生的概率。
例如你去理发店理发,有可能是发型总监给你服务,也有可能是新来的实习生给你服务。发型总监给你服务,你的满意度为99%,实习生给你服务,你的满意度可能只有90%。假定你是第一次去这家理发店且随机指定了一个人给你服务,结果你很满意,那么求发型总监给你服务的概率或者实习生给你服务的概率这个问题就属于贝叶斯分类问题。

条件概率

条件概率通常记为P(B/A),表示在事件A发生的情况下,事件B发生的概率。
上即为事件A发生的条件下事件B发生的概率。设试验的基本事件总数为n,事件A包含的所有情况数量为m(m>0),事件AB包含的情况数量为s,则有

对于上述公式,注意P(A)>0

条件概率P( · |A)符合概率定义的三个条件:
  1. 非负性 对于每个事件B,有P(B|A) >= 0
  2. 规范性 对于必然事件S,有P(S|A)= 1;
  3. 可列可加 设B1,B2,..是两两互斥朴素贝叶斯
    image.png

参考
贝叶斯检验-百度百科
通俗易懂的讲解贝叶斯原理
差异分析--limma包

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容