一、下载Synechococcus elongatus UTEX 2973(accession no.为GCA_000817325.1 )的基因组注释文件,统计其中染色体序列(CP006471.1)前10kb有几个基因(gene)?
要求:只能使用一行shell命令,并将shell命令写和基因数目写在答案处。
登录NCBI官网https://www.ncbi.nlm.nih.gov
ls
gunzip
grep 'CP006471.1' GCA_000817325.1_ASM81732v1_genomic.gff |awk -v FS='\t'
-v OFS='\t' '{if($5<10000){print $5}}'|sort|uniq|wc -l #错误,抓取的特定字符前未加^,导致中间出现特殊字符的基因也被统计进入,结果出错,应只要首字符为特定字符的序列
grep '^CP006471.1' GCA_000817325.1_ASM81732v1_genomic.gff |awk -v FS='\t' -v OFS='\t' '{if($5<10240){print$5}}'|sort|uniq
grep '^CP006471.1' GCA_000817325.1_ASM81732v1_genomic.gff |awk -v FS='\t' -v OFS='\t' '{if($5<10240){print$5}}'|sort|uniq|wc -l #"grep' ' "抓取特定字符,FS表示如何切割文件
二、请按源代码编译安装的方式安装Hisat2软件;
1)软件源码下载地址:ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-source.zip
2)安装说明:https://ccb.jhu.edu/software/hisat2/manual.shtml#building-from-source
请将安装完成后的界面截图或出错的界面截图放在答案处。
(1)cp /disk1/shares/hisat2-2.2.0-source.zip ./
(2)cd hisat2-2.2.0
(3)make
hisat2 -h
2、错误
(1)查看文件目录
三、请以apt-get软件包方式安装Hisat2软件。并将安装成功的界面截图贴在答案处。
错误情况
四、请按课件说明安装anaconda;并运行conda --version将返回的界面截图贴在答案处。
wget https://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh
cp /disk1/shares/Anaconda3-2021.05-Linux-x86_64.sh ./
sh Anaconda3-2021.05-Linux-x86_64.sh
echo 'export PATH=~/anaconda3/bin:$PATH' >>~/.bashrc
source ~/.bashrc #重新执行环境变量
conda --version
错误情况