GDC下载转录组数据(RNA-seq)以及临床数据

打开TCGA GDC的官网


首先清空购物车(右上角cart)
因为改版的原因,以前是直接点Repository,现在要先点Cohort Builder:
选TCGA

然后选你要分析的组织:
以乳腺为例

然后再点Repository:
选RNA-seq

转录组

基因表达值

加到购物车

大于5GB的文件要通过GDC Data Transfer Tool下载

这里给出GDC Data Transfer Tool的下载页面,根据自己的系统选择合适的交互界面,也就是UI界面,这里同时要下载左边的client脚本,否则交互界面没什么作用。
mac是这个
你接下来要把这个东西放到.dtt的文件夹里,至于为什么是.dtt,是因为一开始没下这个东西,然后报错说:
/Users/jiangchengen/.dtt/./gdc-client download c2515ef2-5cfc-4cc2-9541-ae072616d361 -s https://api.gdc.cancer.gov/ -d /Users/jiangchengen/Desktop/expression\ data -n 1
stderr: /bin/sh: /Users/jiangchengen/.dtt/./gdc-client: No such file or directory
解决办法就是把client脚本放到.dtt的文件夹里。
那如何找到这个文件夹?你能找到的路径是不是只能到/Users后面的那个目录?这里可以键盘cmd+shift+.同时按找到隐藏文件夹:

然后把你下载的client放进去:
仔细的小伙伴肯定会发现/Users/jiangchengen/.dtt/./gdc-client这个路径.ddt之后还有个.文件夹,应该把client放到.这个文件夹才对啊?但是你尝试找到这个文件夹发现找不到,具体什么原因我也不清楚,总之向我之前那样操作就可以成功,也期待大佬帮忙解释一下为什么。

manifest

下载的manifest文件,也就是你下载的cart文件的主要信息,因为网页下载的话太慢了,导入GDC Data Transfer Tool里面:


点download即可


失败的日志
成功的日志

你的cart小于5GB,那么中规中矩直接点跟manifest下面的cart即可
这个matedata也要下

下面讲讲临床数据的下载:
清空cart,then
第一个步骤不变,然后Repository里面选临床数据


选clinical
data format选bcr xml

然后加到cart,临床数据比较小,直接点cart,就不用你manifest了,另外矩阵文件metadata也不需要下.

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容