我一开始就是奔着生物信息学来的,最初对这个领域仅仅只有考研目标的概念,其研究重点主要体现在基因组学和蛋白质组学,主要研究方向有基因序列比对、蛋白质比对、基因识别分析、分子进化、序列重叠群装配、遗传密码、药物特性和生物系统等。 从前辈那里听来的入门方法就是用计算机数据库处理一些生物学问题,比如鉴定新的miRNA、lncRNA、circleRNA,miRNA、lncRNA靶基因预测,进化树,蛋白质组数据分析,磷酸化、糖基化位点预测,抗原决定簇预测,临床数据分析。
至于R语言、Linux、C++以及Python、FORTRAN等内容稍微有点超出我的预期,因为这部分编程性大于理学性,我脑海中认为的生信却是生物占比大——这是一个很大的误区。 后来我才明白生信是综合学科,它的优势在于探索,并不仅仅在于简单的跑软件或是生物分析。生信作为一个交叉学科,涉及到的知识非常广泛。
作为一个从本科就开始念生信的人,我觉得应该在初涉猎生信时,学习理论知识尽量认真严谨,向深处钻研,注意避免在科研中不求甚解。 一个学姐告诉我一些入门办法,无非就是多看看BMC、NAR等杂志上介绍的生物信息学数据库。根据自己的需要,掌握一些实用的小工具,例如Venny等。 到目前为止,我还是大一菜鸟,在b站上试水生信类尤其是计算生物学网课不过四十节,仍是门外汉,甚至连生物细胞学、生物化学与分子生物学都还在原地踏步,而这两门课都是从微观角度来认知生物细胞结构和生物现象,且都是生信的基础学科。
生信中一大重点基础——生物统计学,是一门介于生物学与数理统计学之间的边缘学科,以数理统计方法研究和解决生物学问题,这对我们的数学、英语和计算机水平也有很高的要求。最容易被忽略的就是数学了,恰恰大量技术的原理都涉及到统计学,比如泊松分步会应用到测序原理,HMM会应用到序列预测等,如何将统计学应用到生信领域,往深如何理解算法,是一个需要时间积累的过程。
也就是说这是一门结合了外语、计算机、数学和化学等知识处理生物问题的学科,也是新世纪前途无量的领域。