一旦我们对数据质量感到满意,我们就可以开始分析数据了。通常,进入分析的第一步需要将RNA-seq读取映射到基因组。我们可以使用许多工具来执行短读对齐,应该根据分析目标和需求仔细选择。对于RNAseq基因表达分析来说,HISAT2是一种非常快速的工具,在已发表的基准测试中具有良好的性能。
首先是下载最新版本的hisat2,网址:http://daehwankimlab.github.io/hisat2/download/
# cd 进入下载目录
# unzip hisat2-2.2.1-Linux_x86_64.zip
# pwd #查看下载的位置
由于是二进制的可执行文件,所以不用编译,直接加入环境变量
# export PATH=/root/hisat2-2.2.1:$PATH
然后 查看运行情况
# hisat2-build --help
此时可能会提示错误
hisat2-build: /lib64/libstdc++.so.6: version `GLIBCXX_3.4.20' not found (required by hisat2-build)
hisat2-build: /lib64/libstdc++.so.6: version `CXXABI_1.3.8' not found (required by hisat2-build)
hisat2-build: /lib64/libstdc++.so.6: version `GLIBCXX_3.4.21' not found (required by hisat2-build)
就是说版本低了,要升级相关文件的版本
要不降低版本,要不用最新的,
cd /usr/local/lib64
# 下载最新版本的libstdc.so_.6.0.26
sudo wget http://www.vuln.cn/wp-content/uploads/2019/08/libstdc.so_.6.0.26.zip
unzip libstdc.so_.6.0.26.zip
# 将下载的最新版本拷贝到 /usr/lib64
cp libstdc++.so.6.0.26 /usr/lib64
cd /usr/lib64
# 查看 /usr/lib64下libstdc++.so.6链接的版本
ls -l | grep libstdc++
libstdc++.so.6 ->libstdc++.so.6.0.19 #这个一定要反复检查
# 删除/usr/lib64原来的软连接libstdc++.so.6,删除之前先备份一份
sudo rm libstdc++.so.6
# 链接新的版本
sudo ln -s libstdc++.so.6.0.26 libstdc++.so.6
# 查看新版本,成功
ls -l | grep libstdc++
然后执行
hisat2-build --help #成功了