readmaf读取样本名报错

一、isTCGA是个什么参数,到底什么时候加?

首先,对读取gz格式还是txt格式没有啥特别要求


image.png

二、但是读取后,样本名称有显著改变,即sampl barcode有差异

isTCGA = T

image.png

isTCGA = F及为默认值
image.png

嘻嘻,在这里可能暂时看不出来有啥用,但你挑选标本就好用多了
这里报错的原因就是,maf和你提供的样本名不一致导致的

image.png

三、这里提供一个筛选的标准流程

#---临床信息获取,并提取行名1——12位-----------------
clindata$sample <- sub_str(rownames(clindata),1,12)
table(clindata$group)
#---拿到想要的样本名字-----------------------
ID1 <-clindata$sample[clindata$group=="high"]
ID2 <- clindata$sample[clindata$group=="low"]
ID <- clindata$sample

#-------提取特定样本的突变信息-----------------
maf1 <- read.maf('All_maf.txt',isTCGA = T)%>%subsetMaf(tsb = ID1)
maf2 <- read.maf('All_maf.txt')%>%subsetMaf(tsb = ID2)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 背景介绍 随着癌症基因组学的进步,突变注释格式(MAF)被广泛接受并用于存储检测到的体细胞变体。 癌症基因组图谱项...
    oddxix阅读 23,120评论 1 61
  • 一次简化基因组数据分析实战 尽管目前已经有大量物种基因组释放出来,但还是存在许多物种是没有参考基因组。使用基于酶切...
    xuzhougeng阅读 14,809评论 10 40
  • 细数绘制一张全景图所遇到的坑 大家好,我是生信技能树学徒,前面我们带来了大量的表达数据挖掘实战演练,但是TCGA数...
    村狗儿阅读 1,441评论 0 1
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,587评论 28 53
  • 信任包括信任自己和信任他人 很多时候,很多事情,失败、遗憾、错过,源于不自信,不信任他人 觉得自己做不成,别人做不...
    吴氵晃阅读 6,216评论 4 8