往年寒暑假都是以在家写文章度过,今年在校时候完成了,所以就把读书提上了日程。对于读书,我以前是不愿去做的,毕竟实验和文献已经消耗了大量精力。很多人读完文献可能都曾感慨:别人怎么想到的,这方法也不难啊,我怎么想不到!而想不到的原因还是知识薄弱和不懂运用,于是我开始去读一些专业书籍来帮我融会贯通。下面我以刚读完的由樊龙江老师主编的《植物基因组学》为例聊聊。这里我不会谈到书本知识,建议看原书。
该书分为两大篇——总论(书本常见的排布方式)和各论(拟南芥、水稻、玉米、小麦、大豆、棉花、油菜等单设章节)。在总论部分,最直接的收获就是学到了新的术语,明确了一些术语的准确释义(百度查不到、文献不会写),解决了许多遗留问题。更重要的是书相比文献更全面、易懂,读完会形成一个框架,使思维发散,了解哪些更值得做。在各论,能进一步认识研究相关的植物。当然,你不能指望读完就会基因组分析了,每个章节并不算详细,更没有实战,框架想填满还得日积月累。
其实,说来说去都是废话文学,只是想让大家意识到开卷有益,趁着还有精力赶紧读上几本,获益匪浅。另外,我读组学相关的书也是为了打破生物信息学习的局限。有不少人问过我怎么学生信,我认为首先得搞清楚自己的定位,你是能看懂生信的图片就好(很容易实现),还是想完成发表级的数据分析(大部分人的目标),更甚是开发软件算法?比如我对自身的定位就是解决生物问题,不会追求强大的编程能力。精力十分有限,得考虑清楚如何分配时间才能最大化效益。
新人入门第一步,补基础——Linux常用命令和至少一门计算机语言。建议选择R,见效快,有了出图的成就感不容易弃坑。然后,我建议有目的的学,比如课题以后要用到的分析,这样才有动力。如果真没目的,那就挑篇自己感兴趣的文章,用它公开的原始数据和代码复现图片吧。以单细胞转录组为例,前几天得先了解下发展史、主流建库测序技术原理、该组学的特殊优势和能解决哪些问题。之后,找几篇大佬们发布的教程慢慢推进,像生信技能树、单细胞天地、各大生物公司的公众号就是不错的首选。这个过程需要反复搜索术语和命令的含义并理解,判断分析结果是否可靠并解读,冒进和丢给生信交流群是没用的。走完流程后,应该已经能初步使用分析所需的软件了,建议再阅读它们的官方英文教程。因为技术贴只写通用流程,你需要针对材料优化参数,比如动植物很多时候是有差别的,能直接照搬以人为例的教程吗。
不得不谈的一点是,为什么不建议直接死扣相关文献,因为刚接触不可能读透。这也是实验室主要矛盾之一:老板给你一篇文献并认为你两三天能读透,你从未接触过该领域,因为被老板push而急于求成,专注文献好几周甚至逐字翻译也没懂,然后老板觉得你很废柴,你又觉得自己很无辜。一个不会引导,一个不会学习,钝角(梗)!只有在基础扎实的情况下读,才能把别人的思路用到自己的课题,取长补短。至于写文章,第一篇可以采取模仿相似论文的一般内容、挖掘自己课题的特别内容的策略。在解读结果时想到什么随时记录,即使想错了,尤其注意奇怪的点,可能写出来就是亮点。
想要有长足的发展,就得注意日常积累了,让知识转变为常识——生物学常识、统计学常识和计算机常识。如果你真要走上开发软件算法的道路,得先接受文章发表后无人问津的可能,不得不承认,我们常用的软件算法仅出于几人之手。
言尽于此,仅供参考,希望大家都能找到适合自己的学习方式。祝新年快乐,科研顺利!