作业1
1-1下载基因注释文件并统计gene数目
#下载Synechococcus elongatus UTEX 2973(accession no.为GCA_000817325.1 )的基因组注释文件
#解压缩
gunzip GCA_000817325.1_ASM81732v1_genomic.gff.gz
#查看文件
less GCA_000817325.1_ASM81732v1_genomic.gff
#统计其中染色体序列(CP006471.1)前10kb有几个基因(gene)
grep $'^CP006471.1\tGenbank\tgene' GCA_000817325.1_ASM81732v1_genomic.gff |awk -v FS='\t' -v OFS='\t' '{if($5<10000){print $5}}'|sort|uniq|wc -l
1-2预编译安装hisat2
#下载压缩包
wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-source.zip
#screen创建另一个界面
#解压缩
unzip hisat2-2.1.0-source.zip
#到hisat2-2.1.0目录
cd hisat2-2.2.0
#报错
包中没有文件,重新下载源文件,重复步骤
1-3、apt-get软件包方式安装Hisat2软件
#安装hisat2软件
sudo apt-get install hisat2
#检查是否安装成功
hisat2 -h
1-4、conda安装
wget https://repo.anaconda.com/archive/Anaconda3-2021.05-Linux-x86_64.sh
bash Anaconda3-2021.05-Linux-x86_64.sh
#检查是否安装成功
conda --version
#报错
conda:command not found
解决方法:
#进入
vi ~/.bashrc
#在最后一行加上
export PATH="/root/anaconda3/bin:$PATH"
#wq保存退出后
source ~/.bashrc
#查看是否成功
conda --version
作业二
2-1Aspera快速传输文件的下载
#下载
$ wget https://ak-delivery04-mul.dhe.ibm.com/sar/CMA/OSA/09cne/0/ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz
#解压当前目录下的压缩文件到~/biosofts
$ tar -zxvf ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz -C ~/Biosofts
#安装
## 执行 sh文件,上一步解压生成的
./ibm-aspera-connect-3.11.0.5-linux-g2.12-64.sh
#查看是否安装成功
~/.aspera/connect/bin/ascp -h
#设置环境变量
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
#使之生效
source ~/.bashrc
#查看是否可以使用, 有输出帮助文档则安装成功
ascp -h
2-2安装SRA-toolkit
(1)apt-get安装
sudo apt install sra-toolkit
(2)预编译方式安装
#下载sra-toolkit安装包
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.10.9/sratoolkit.2.10.9-ubuntu64.tar.gz
#解压缩 到文件~/Biosofts/sra-toolkit 中
tar xzvf sratoolkit.2.10.9-ubuntu64.tar.gz -C ~/Biosofts/sra-toolkit
cd sratoolkit.2.10.9-ubuntu64
cd bin
./ prefetch -h
#配置环境
echo 'export PATH=~/Biosofts/sra-toolkit/sratoolkit.2.10.9-ubuntu64/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
#查看是否安装成功
prefetch -h
#报错
vdb-config --interactive
#查看是否安装成功
prefetch -h