RNA-seq从入门到自闭(数据下载)

使用TBtools,大家可以轻松从NCBI和ENA获得文件的下载地址。接下来就是下载SRA文件。



sra文件的下载方式有很多种,你可以用迅雷离线拖,百度离线下载,也可以用选择网页下载。
在这里我简单介绍上述方法外的三种下载方式。

1. wget下载

wget是linux下常用的下载方式,首先你需要安装linux。如果你是win10系统,把系统升级到最新版也能安装一个linux系统。具体安装方法可以参考下面的链接(不是最新攻略,参考就好)。希望大家都能从这一步开始装上linux子系统,因为未来介绍的命令行操作都只能在linux shell下实现。需要注意的是,安装linux子系统需要留出8G左右的空间,如果你的C盘不够大就只能自己想办法了。
https://zhuanlan.zhihu.com/p/62658094
之后还需要安装wsl-terminal。具体的安装方法参考这里。
https://github.com/mskyaxl/wsl-terminal/blob/master/README.zh_CN.md#%E5%B7%A5%E5%85%B7
安装好linux和wsl-terminal后,就能用wget下载数据了。这里以ENA的ftp地址为例。首先你需要新建一个文件夹(文件名最好有自己固定的风格,例如:SRA_Triticum_Aestivum_drought_2020-9)。命名不规范,以后改起来太麻烦。


之后右键打开wsl-terminal

你可以在这里输入你需要的命令了。注意这里没办法使用ctrl+v这类快捷键。

最好还是用右键复制+粘贴吧。

说回下载地址,从图中不难看出,所有的地址只有在00B和SRR51316AB上有差别,其中B这位数可以看作是AB的最后一位数,在数学上可以通过取余数获得。随手百度发现linux shell的取余数代码是:

$(($i % 10));

for语句同理也能搜到,

for i in `seq 56 79`; 
do
    j=$(( $i % 10 ));
    wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/00${j}/SRR51316${i};
done

当然你可以使用更加粗暴的语句:

wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/006/SRR5131656
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/007/SRR5131657
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/008/SRR5131658
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/009/SRR5131659
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/000/SRR5131660
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/001/SRR5131661
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/002/SRR5131662
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/003/SRR5131663
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/004/SRR5131664
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/005/SRR5131665
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/006/SRR5131666
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/007/SRR5131667
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/008/SRR5131668
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/009/SRR5131669
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/000/SRR5131670
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/001/SRR5131671
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/002/SRR5131672
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/003/SRR5131673
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/004/SRR5131674
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/005/SRR5131675
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/006/SRR5131676
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/007/SRR5131677
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/009/SRR5131679
wget ftp.sra.ebi.ac.uk/vol1/srr/SRR513/008/SRR5131678

怎么说呢,又不是不能用!



上一次程序员朋友看到我的代码就给我发了这张图,你们说是不是该跟他绝交了。按你胃,有不是不能用!反正能跑就行了。
最后贴一下wget参数一览

-A<后缀名>:指定要下载文件的后缀名,多个后缀名之间使用逗号进行分隔;
-b:进行后台的方式运行wget;
-B<连接地址>:设置参考的连接地址的基地地址;
-c:继续执行上次终端的任务;
-C<标志>:设置服务器数据块功能标志on为激活,off为关闭,默认值为on;
-d:调试模式运行指令;
-D<域名列表>:设置顺着的域名列表,域名之间用“,”分隔;
-e<指令>:作为文件“.wgetrc”中的一部分执行指定的指令;
-h:显示指令帮助信息;
-i<文件>:从指定文件获取要下载的URL地址;
-l<目录列表>:设置顺着的目录列表,多个目录用“,”分隔;
-L:仅顺着关联的连接;
-r:递归下载方式;
-nc:文件存在时,下载文件不覆盖原有文件;
-nv:下载时只显示更新和出错信息,不显示指令的详细执行过程;
-q:不显示指令执行过程;
-nh:不查询主机名称;
-v:显示详细执行过程;
-V:显示版本信息;
--passive-ftp:使用被动模式PASV连接FTP服务器;
--follow-ftp:从HTML文件中下载FTP连接文件。</pre>
来源:https://man.linuxde.net/wget

2. Aspera

TBtools里已经支持这一功能,并且从NCBI和ENA获得的地址中也包含了Aspera的地址。具体操作看这里
https://mp.weixin.qq.com/s/YYneVPb3V6Dq5WXiq2JYTQ
如果你对命令行的方式感兴趣,可以在linux下安装aspera。具体安装可以参考这篇文章
https://www.jianshu.com/p/44265b4ab0b2
因为aspera功能总出问题,本人的网络也被禁用了aspera下载需要的端口。所以就仅供参考吧。

3. XDM

其实有了地址,用浏览器下也好用迅雷下也好都是一样的。之前也有人推荐过IDM
https://www.internetdownloadmanager.cn/
是个收费软件,那么有没有更香的软件,最好是免费的?
有的!
https://subhra74.github.io/xdm/


安装好界面

点击加号添加文件

添加地址后点击开始

小结:本文简单介绍了下载sra文件的几种方式,同理,同样也可以用类似的方式下载fastq文件。最后,祝磕盐顺利。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,922评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,591评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,546评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,467评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,553评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,580评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,588评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,334评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,780评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,092评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,270评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,925评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,573评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,194评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,437评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,154评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352