强调!! all of all都是个人观点~
首先,入这个坑是因为阴差阳错(这里就不展开了)。
至于没有脱坑,是因为来去自由,不用做实验,方便划水(bushi)。
一开始以为的做生信就是分析数据,装b地说是实验结果和数据的赋予者,听起来很伟大,但在做湿实验同门眼里应该是闲人一个…
本科前几年接触的生信皆是分子进化云云,自我感觉进化的故事除非是做大,大到cns,大到诺奖,否则总是虚无缥缈的感觉。当然既然现在诺奖已出,以后被关注甚至趋势大好也不是不可能。
闲的空虚+升学需要,大四的时候开始自学了一些组学分析,不过都是皮毛,润一润别人写好的pipeline。即便是自己本地跑,基本的从测序数据到heatmap等只要入门了都是大同小异。
最近研一刚开学,和导师几经交流,发现生信分析需求大增(画饼),但我这点三脚猫功夫怎么对付呢?anyway我还得多多学习!!!这也是开这个账号的原因,我跟学的简书教程都是大佬写的,虽然教程简洁明了一气呵成,但是我在跟学过程中可谓是磕磕绊绊(看吧,大佬根本不会知道菜鸟会在哪里跌倒然后就爬不起来然后就半途而废.·´¯`(>▂<)´¯`·.)。
想必这种时候需要我这样一个从零开始摸爬滚打的小白,在实践中无限犯错,记录下自己的学习历程和踩过的坑,希望能给和我一样的朋友避避雷~
回归正题…生信是什么
和学校一位生信大牛的导师聊天的结论:
我认为生物信息学涉及的领域还是很广的,真正隔行如隔山。因为是数据科学的一个衍生物,所以利用数学、信息学、统计学和计算机科学的方法研究生物学问题的都叫生物信息学。同是做生信的,互相对牛弹琴不在少数。
但总的来说,生信为两块,一块是应用层面的,比如常见的基因组学、蛋白质组学、翻译组、转录组、单细胞测序数据的分析……另一块是开发,主要包括算法、数据库、软件、工具包等的开发,这就需要比较硬核的数学和计算机背景。要注意的是,应用层面的工作基本都是基于开发的,应用已经开发的数据库、算法、软件、r包等对拿到手的raw data完成相应的分析工作,目标是发现某些生物现象、规律。要不说学物理、数学、计算机的转到生物是降维打击呢……
但是!!要做一个优秀的生物信息学工作者怎么能没有生物学基础呢!!借用上课的时候一位老师说的:找专门学计算机的人合作生信,他们的一根筋能让你气炸!所以一个课题组里有一个自己的生信传统还是很必要滴~这样才能有效地将big data有效转化成生物学思想~