下载dbGap数据

第一次下载,记录一下。欢迎小伙伴提提建议,有什么更好更快的下载方式和操作

https://mubu.com/doc/a8VEr7Tfb0


找的时候居然忘记之前写过记录。。。😅


参考:https://github.com/JiFansen/Blog/issues/37

其他参考:

https://anjingwd.github.io/AnJingwd.github.io/2017/08/06/SRA%E6%A0%BC%E5%BC%8F%E6%95%B0%E6%8D%AE%E5%8A%A0%E9%80%9F%E4%B8%8B%E8%BD%BD%E6%89%93%E5%8C%85%E8%A7%A3%E5%86%B3/

https://www.jianshu.com/p/80428485c897

下载和安装软件

wget https://download.asperasoft.com/download/sw/connect/3.9.1/ibm-aspera-connect-3.9.1.171801-linux-g2.12-64.tar.gz

解压:tar zxf ibm-aspera-connect-3.9.1.171801-linux-g2.12-64.tar.gz

安装:sh ibm-aspera-connect-3.9.1.171801-linux-g2.12-64.sh

添加到环境变量:

echo 'PATH=$PATH:~/.aspera/connect/bin/' >> ~/.bashrc

source ~/.bashrc

测试 ascp --help

使用conda安装sra-tools

conda install -c bioconda sra-tools

下载表型数据

使用ascp客户端,照着dbGaP的指示操作,然后更改程序或配置文件路径即可(也可以使用krt文件下载)

在My projects里面下载解密秘钥

加载秘钥文件

切换到Repository文件夹下,运行解密命令,直接解密文件夹

下载Run数据,参考prefetch用法

https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc&f=prefetch

一般使用2种文件,要么是accession list要么是krt文件

nohup prefetch -o kart -X 9999999999999 ~/biodata/dbGap/krt_files/cart_prostate_wxs_* &

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容