linux 批量下载TCGA数据

将该文件放在linux的   /home/zdwu/rnaseq/11_source_data  目录下,并在该目录下批量下载数据,代码如下:

cat gdc_sample_sheet.2018-05-22.tsv |while read line

do

echo https://portal.gdc.cancer.gov/files/${line:0:(36-0)}

wget -c https://gdc-api.nci.nih.gov/data/${line:0:(36-0)} -O ${line:167:(184-167)}'.htseq.counts.gz'

done


用如下命令,确认文件个数是否完整,完整后数据备用。

ls A-*| wc -l

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。