生物信息学是生物学、信息学和数学结合的学科,即应用数学、信息学、统计学和计算机等学科研究生物学问题的学科,作为一门新兴的交叉学科,以基因组DNA序列信息分析为出发点,以大数据为基础,进行基因组学、转录组、蛋白质组学、代谢组学等多层面的研究。
狭义层面上的基因组学,是应用信息科学的理论、方法和技术,管理、分析和利用生物信息数据。广义层面上,利用信息科学的方法和技术,研究生物体系和生物学过程的中信息的存储、内涵和传递等,研究和分析生物体细胞、组织、器官等部分中蕴藏的生物信息。生物信息学伴随着基因组学的研究而发展,也就是说生物信息学可以完成对基因组学数据的获取、加工、存储、分配、分析和解释等。
近几年来,高通量测序技术的发展,直接推动着生物学数据的增长,充分利用这些数据解释生物学领域的复杂生命系统的奥妙成为近几年的研究热点。目前,针对基因组、转录组、表观基因组、代谢组等不同层面的分子水平数据,各研究单位开发了集成的、专门的数据库及数据分析软件,为数据的储存、处理、分析提供了资源和工具。
生物信息学的应用步骤:
1.对海量数据的收集、整理与服务,即管理好这些数据,即各个生物数据库的建立与管理,以及对生物信息相关书库的应用。
2.利用数理统计方法、数值计算等方法从中发现规律,研究生物信息学问题。
1)把DNA序列信息作为分析源头,找到基因组序列中代表蛋白质和核糖核酸(RNA)基因的编码区。
2)阐明基因组中存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律
3)归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,解析代谢、发育、分化和进化的规律。
3.基于已有数据资料的处理分析结果,提出具有重要生物学问题,开发新型工具和算法,引领生物信息学领域研究方向。
生物信息学的应用领域:基因组序列的分析和解释、基因多态型、基因表达调控、与某性状相关的基因鉴定、基因产物的结构与功能预测、基因进化等。
生物信息学的研究内容:对于基因序列、蛋白质序列和转录组序列等分析问题,都是从数学方面描述成字母的排序问题,但描述的问题和研究的问题不同。如蛋白质序列问题是发现蛋白质分子上的功能性模体和使用这些motion来给新的基因序列进行有效的分类。