1.生物信息学是一门非常顺应时代的学科,为何要这么说呢,我们来看看它的学科基础:生命科学与医学,计算机科学,数学特别是统计学。
不是那谁谁谁说过,“21世纪是生命科学的世纪”吗?其实一切科学都是围绕“人”这个本体在转,人们也越来越重视健康和个人医疗,这一切都离不开对生命的探索。
计算机毋庸置疑是人类最伟大的发明之一,我们的生活已经离不开计算机,不久的将来,人工智能将带给我们更多的不可思议。
不管你愿不愿意,我们的生活都充满了数学。科学的最终目的是探究现象的本质,发现事物的规律,这就需要将他们量化和抽象化。
而生物信息学正是融合了这些学科,另外乘上了“二代测序”这条大船,变得炙手可热。
同时,生物信息学正不断开疆拓土,容纳其他基础学科,例如药学–药物基因组学,结构生物学-结构生物信息学……
本来,科学不分家,数学、物理、化学、生物……都是息息相关的,生物信息学只是再次将他们融为一体,探索生命的奥秘。让我想起了道德经“道生一,一生二,二生三,三生万物”的思想,也许循道-追寻真理的过程就要“百川归海”、万法归一。
2.这里不讲生物信息学的理论,一是自身造诣不够-完全一个初学者;另外,之前也提到了,他是时代的产物,他紧跟时代的步伐,所以他的理论是进步的。
所以这里只讨论生物信息学需要掌握的基本技能,而且生物学你们都是专家,这里只讨论需要掌握的关于计算机的基本技能。并以RNA-seq与ChIP-seq作为案例分析。
3.首先是对电脑硬件的基本了解,cpu/内存/硬盘,这些和了解手机基本性能差不多。需要注意的是,处理生物数据的计算机要求着实不低。生物大数据,特别是各种组学数据,例如基因组/转录组/蛋白质组/……,每个样品原始数据的容量至少几十上百个G,这就对数据存储/传输/处理有要求。
但最终还是和你的需求以及财产预算有关。
3.Windows与Uinux/Linux之争从未停止过。虽然可视化的界面为我们理解计算机提供了一扇窗,但实际上却关上了我们认识计算机的大门。对于计算机,一切都只是数据;而Linux系统更方便人们去操纵数据。
当然,合适的才是最好的。使用Office软件办公,Illustrator修图,都是Windows擅长的,也是你擅长的。
而我要强调的是,目前大部分生信分析软件还都是基于Linux的,可视化分析还需要计算机专家继续努力。
最后,Linux可能并不是你想象那么难,只是你还没开始就放弃认识他了。
4.
如果将计算机简单的当做工具的话,我们只需要记住他的使用规则,编程也一样。
8.学习基本流程并不困难,困难的是需要达到你一定的预期。这就需要你具有足够的耐心,去学习他的各种参数,去了解他的基本原理。
一个例子就是白顺师兄所见证的,参数稍改一下,结果就天差地别。另外叶老师的RNA-seq数据也给我足够的教训。