我的生信之路

2022-2-7 凌晨

我很喜欢思考问题,所以有时候显得想的很多。我的生信学习一路走来,我积攒了数篇学习笔记、学习计划和学习总结,临到最近,我想不起来学习过程中许多的细节,头脑似乎都在琢磨今后要走的路,所以与其说今天这篇文章是总结,不如说是未来的思考和方向。

定位我的方向

我学习生信将近3年,真是一点也不敢说自己是生信进阶了,只敢说自己一句入门了。这个交叉学科的涉及范围之广泛,包容性之巨大,让我时时疑问到底我应该往哪条路继续。在这里,我们简单地理解生信为计算机+生物。测序分析是它,进化推演是它,结构摸索是它,分类回归是它……处处皆有它,那么复杂,那么多样。

我接下来想做的,是测序数据分析+ 模型研究人体疾病。

三个专家

在我学习神经网络的一门课程里,提到一个完整的机器学习模型或者说产品的故事:

截图自Dive Into Deep learning课程PPT

总的来说,就是领域专家定义问题,预测结果和行为;数据科学家根据问题对数据进行梳理和分析,选取模型或者自训练模型解释数据;AI专家对模型的精度和性能进行研究和提升。

原作者解释,三个专家,时常身份重叠。因此我初步诞生了我的定位和方向:我想成为三个专家,没错,三个。

做什么

首先我们借鉴机器学习的一个重要计算方式:反向累积/反向传递,进行一个梳理,有了明确的目标,就能够推导接下来我该怎么办了。

1.领域专家
对领域的熟悉不是一朝一夕能够练就的。大概和每个实验室都有自己独特的实验配方和技巧一样,领域的掌握不是一两天可以说完的。我正处在转方向的关键时期,博士的毕业后虽然确实可以改变方向,但是随着对领域的理解不断深入,作出成果的可能性越高,也更容易出彩。

我想我博士就应该选择一个自己已经有一定了解,并且真的非常感兴趣、有前景的领域,并且坚持在这个领域做下去,我选择人体疾病。接下来2-3个月,我会重点去了解肿瘤领域的基础知识和前沿信息,一旦进入肿瘤领域,这个全世界最聪明最优秀的医学工作者扎堆的地方,拼命就是一种必然。

2.数据科学家
说到这个问题,我就知道,该来的总会来的。统计学、数学必须好好学,一个优秀的数据科学家不是单纯的会跑脚本,会写程序就结束了,必须了解背后的算法以及数学意义,它的理论。

3.AI专家
说实在的,我大言不惭地说自己相当三个领域的专家时,并不是相做一个在每个领域都能对所有知识如数家珍的人。生物我就只研究肿瘤,数据科学我就针对于测序数据和生物系统数据,而AI,我想针对神经网络或者更小一些的范畴——RNN、GNN或者CNN。

怎么做

一年为限

时间段 任务内容 目标
1-2月 R语言基础和进阶 达到写包的水平
1-2月 GNN和pytorch入门和应用 熟练应用pytorch进行模型训练,入门GNN
2-3月 GNN和pytorch应用和研究计划 1.熟悉熟读生物领域应用Deep learning的文章;2.完善研究计划
4-6月 第二个项目 1.GNN实战,完成写作;2.备考GRE
7月 考GRE和研究新项目 完成GRE考试
8月 新项目准备 新项目文献收集
9-12月 1.申请学校;2.完成第二个项目 申请北美和欧洲学校;完成第二个项目和投稿
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容