Aspera及SRAToolkit的安装运行
一:Aspera的安装
1.建立安装文件夹
mkdir ~/Biosofts
cd ~/Biosofts
2.下载源代码
wget https://download.asperasoft.com/download/sw/connect/3.6.2/aspera-connect-3.6.2.117442-linux-64.tar.gz
3.解压
tar zvxf aspera-connect-3.6.2.117442-linux-64.tar.gz
4.加入shell脚本
sh aspera-connect-3.6.2.117442-linux-64.sh
5.测试Aspera是否安装成功
~/.aspera/connect/bin/ascp -h
6.配置环境变量
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
7.测试Aspera路径是否成功加入环境变量
ascp -h
二:SRAToolkit的安装
1.下载源代码到Biosofts
wget -P ~/Biosofts/ https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-ubuntu64.tar.gz
2.解压
tar zvxf ~/Seqs/sratoolkit.2.9.2-ubuntu64.tar.gz -C ~/Biosofts
3.测试安装是否成功
~/Biosofts/sratoolkit.2.9.2-ubuntu64/bin/fastq-dump -h
4.配置环境变量
echo 'export PATH=~/Biosofts/sratoolkit.2.9.2-ubuntu64/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
5.再次测试安装是否成功
fastq-dump
三:Aspera下载SRA文件
1.建立Seqs文件夹保存下载序列
mkdir ~/Seqs
2.下载SRA文件到Seqs文件夹
ascp -T -i /home/huangxun/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR620/SRR6208854/SRR6208854.sra ~/Seqs/
这个失败了,但是perfetch能成功,
还可以从ENA数据库下载
ascp -P 33001 -k 1 -l 200m -T -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR620/004/SRR6208854/SRR6208854.fastq.gz ./
3.批量下载
nano ~/Seqs/sra_list.txt
/sra/sra-instant/reads/ByRun/sra/SRR/SRR623/SRR6232298/SRR6232298.sra
/sra/sra-instant/reads/ByRun/sra/SRR/SRR623/SRR6232299/SRR6232299.sra
按ctrl+x保存退出
4.批量下载sra_list.txt列表中的文件
ascp -T -i /home/huangxun/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp --file-list ~/Seqs/sra_list.txt ~/Seqs/
这个也失败了
四:prefetch命令下载SRA文件
1.下载单个文件
prefetch SRR6232298
2.下载多个文件
prefetch --option-file Seqs/SRR_lists.txt
五:解压SRA文件
1.解压为gz文件,节省空间
fastq-dump --split-files ~/ncbi/public/sra/SRR6232298.sra
2.批量解压
#!/bin/sh
for i in *sra
do
echo $i
fastq-dump --gzip --split-files $i
done
Fastqc安装及运行
一:java环境安装
1.建立/usr/java目录
sudo mkdir /usr/java
2.解压
sudo tar -zvxf ~/Biosofts/jdk-8u172-linux-x64.tar.gz -C /usr/java/
3.相关目录建立软连接
sudo cd /usr/java
sudo ln -s jdk1.8.0_172 latest
sudo ln -s /usr/java/latest default
4.配置环境变量
sudo echo 'export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH'>> /etc/profile
sudo echo 'export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar'>> /etc/profile
source /etc/profile
5.测试是否安装成功
java -version
二:fastqc安装
1.创建安装文件夹
cd ~/Biosofts
2.下载
wegt http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.7.zip
3.建立子目录
mkdir ~/Biosofts/fastqc
4.解压
unzip ~/Biosofts/fastqc_v0.11.7.zip -d ~/Biosofts/
chmod +x ~/Biosofts/FastQC/fastqc
~/Biosofts/FastQC/fastqc -h
5.配置环境变量
echo 'export PATH=~/Biosofts/FastQC:$PATH'>>~/.bashrc
source ~/.bashrc
6.检测是否安装成功
fastqc -h