计算机和人工智能的快速发展,加之新的测序技术的革新和成本的下降,生命科学和计算机科学的交融也越来越密切。谷歌的alphafold已经揭示了蛋白质的折叠密码,被称之为解密了上帝的最后一层面纱。从DNA序列,到RNA序列,到密码子的发现和蛋白质结构的解析。生命科学领域里,人工智能和计算机科学的应用不断加强。生信这门功课,做生物这块的不学,似乎有点举步维艰了。
按照自己的学习路径,用简书把学习的过程和体会记录下来,一方面方便自己回头看,另一方面也是为后来人留点不用走弯路的点子,我的生信之路,前面都会是非常基础的内容,也希望自己以后不要犯这些简单的错误。
学习生信,第一步就是安装linux系统。
linux在国内用的最多的有两个版本,一个是源自红帽(Red hat)centos,一个是可视化比较好的ubuntu。生信小白基本用的都是ubuntu。下载地址可以直接去linux的官网下载(https://www.linux.org/pages/download/),或者上国内的镜像下载(清华镜像:https://mirrors.tuna.tsinghua.edu.cn/),我是在官网下载的ubuntu桌面版18.04.2(https://ubuntu.com/download/desktop)。不用国内镜像是因为不会用,哈哈。
windows下安装可以参考链接:https://tutorials.ubuntu.com/tutorial/tutorial-create-a-usb-stick-on-windows?_ga=2.181842407.1996168906.1561620142-889606199.1561620142#0
下载后准备一个空的U盘,建议4G以上,下载U盘系统建立工具Rufus(https://rufus.ie/)下载后打开就能直接用,这个软件小巧方便。用Rufus制作好安装U盘后,就可以准备安装ubuntu了。
如果是安装双系统,则需要在电脑的硬盘分出一个额外的区域(Win10的磁盘管理可以直接分区),或者买一个新的硬盘(推荐固态硬盘)。然后重启电脑,再开机的时候狂按F12,然后选择U盘启动,如果不行就自己百度看要怎么去进入选择开机进入系统的页面了,有的电脑还需要在bios里面做一些更改,进入bios则是在电脑启动时狂按F2(不同的电脑可能不一样)。进入之后选择第一个是进入U盘的ubuntu系统,第二个则是直接进行安装,具体的安装唯一要注意的就是选择安装盘,不要把自己windows下的数据给删除了。另外建议安装时候选择最小安装,这样安装起来比较快且不会装一些用不到的软件(比如办公软件等,因为这些可以换到windows下去做)。【安装过程中如果选择自己的硬盘分区,我的是一共50G固态,分区详细为:1G efi(主分区,起始),8G交换空间(我的内存是8G,交换空间一般和内存一样大),/ 分区10G(逻辑,起始,ext4),/urs 分区15G(逻辑,起始,ext4,用于安装软甲),/home 剩下的全给了(逻辑,起始,ext4,用于存放数据)】
安装完之后第一件事,就是选择更新源,更新源的方法比较简单。打开电脑的livepatch,选择ubuntu软件,点击下面的下载自的下箭头,选择其他站点(截图是我已经选择了清华的镜像)。
点进去后在中国的下拉栏里面选择清华源。
点击选择服务器,然后点击关闭,系统会自动更新下载。更新完之后打开终端,输入sudo apt-get update。等待更新后就OK了。如果有软件需要更新,再输入 sudo apt-get upgrade就好了,一路Yes下去。
至此,生信入门第一步,安装linux系统已经结束,后续开始配置环境和安装软件了。