biotar 学习笔记(2-2)--- 环境配置、数据的重复性
系统安装完毕了,就存在进行软件的安装。
对于linux来说,主要包括三种软件安装方式:
- 绿色软件,解压可用。
- 源代码的文件,需要编译。
- 使用系统软件商店或者叫镜像也行。
当然前两种方式对于大多数人来说,都是比较麻烦的,有没有像第三种方式一样能把大部分软件通过一句命令就能安装呢?答案是有的,那就conda。这个的总结洲更班长总结的已经很完善。
洲更conda笔记三部曲
配置可重复性。
这个是最近才有的体会,比如说你有好几个电脑都想有相同分析环境,这个不免会把有的软件可能会重新装一遍.
- 那么这个时候,最好是不要去乱去重新一个新的文件夹。比如说在电脑1上使用biosoft文件夹来装软件,那么在电脑2上也请用biosoft文件夹,因为的记录一次的安装代码可以随意的重复使用。
- 请善待路径中的~,你会喜欢上它的。
- 如果是联网的电脑,一个软件安装脚本就可以帮你搞定一台新的电脑的配置。
- 当然环境的移植,conda也可以,或者还有其他的方式,有待发掘。
数据的重复性
我的理解有以下几点:
- 生信的学习必经之路,这个就跟我们做完题,会去对一对标准答案一样的。
- 数据的重复,必须基于的是软件及其版本一致,基因版本,注释文件版本和数据库版本一致。
- 测序的数据不应该一次用完就抛在一边,那样太可惜了,因为数据库在更新,以及联合分析多篇文章的数据都可能有新的科学发现。