GISTIC2输入文件准备

GISTIC2本地版用起来难度大,建议使用在线版本:https://cloud.genepattern.org/gp/pages/login.jsf;

具体方法参考:https://www.jianshu.com/p/4312a453b4a4?clicktime=1578478942

但特别注意的是,这个作者准备输入数据的代码有误,错误原因在于把样本名16个字符以后的删除之后,会导致不同的样本有同样的样本名,结果就是导致GISTIC2报错,说有overlap;只要保持样本名不变即可,具体代码,如下,仅供参考:

library(dplyr)

library(TCGAbiolinks)

query <- GDCquery(project = "TCGA-GBM",

                  data.category = "Copy Number Variation",

                  data.type = "Masked Copy Number Segment")

GDCdownload(query, method = "api", files.per.chunk = 100)

segment_dat <- GDCprepare(query = query)

head(segment_dat)

segment_dat$GDC_Aliquot <- segment_dat$Sample

segment_dat$Sample <- substring(segment_dat$Sample,1,16)

head(segment_dat)

segment_dat <- grep("01A$",segment_dat$Sample) %>% segment_dat[.,]

#segment_dat[,1] <- segment_dat$Sample原来有错误的地方,千万不能这么写

segment_dat <- segment_dat[,-7]

write.table(segment_dat,"MaskedCopyNumberSegment-2.txt",sep="\t",

            quote = F,col.names = F,row.names = F)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、简介 Samtools是一个用于操作sam和bam格式文件的应用程序集合,具有众多的功能。 它从SAM(序列比...
    Davey1220阅读 21,405评论 2 33
  • 第一天 7月13日OCP笔记: Oracle Ocp11g准备资料: OracleFundmentals 书 管理...
    fjxCode阅读 2,845评论 0 4
  • 背景介绍 随着癌症基因组学的进步,突变注释格式(MAF)被广泛接受并用于存储检测到的体细胞变体。 癌症基因组图谱项...
    oddxix阅读 23,265评论 1 61
  • suppressPackageStartupMessages(library(CLL)) data(sCLLex)...
    裁尘的人儿阅读 1,544评论 0 1
  • 表情是什么,我认为表情就是表现出来的情绪。表情可以传达很多信息。高兴了当然就笑了,难过就哭了。两者是相互影响密不可...
    Persistenc_6aea阅读 126,322评论 2 7