2022-2-7 凌晨
我很喜欢思考问题,所以有时候显得想的很多。我的生信学习一路走来,我积攒了数篇学习笔记、学习计划和学习总结,临到最近,我想不起来学习过程中许多的细节,头脑似乎都在琢磨今后要走的路,所以与其说今天这篇文章是总结,不如说是未来的思考和方向。
定位我的方向
我学习生信将近3年,真是一点也不敢说自己是生信进阶了,只敢说自己一句入门了。这个交叉学科的涉及范围之广泛,包容性之巨大,让我时时疑问到底我应该往哪条路继续。在这里,我们简单地理解生信为计算机+生物。测序分析是它,进化推演是它,结构摸索是它,分类回归是它……处处皆有它,那么复杂,那么多样。
我接下来想做的,是测序数据分析+ 模型研究人体疾病。
三个专家
在我学习神经网络的一门课程里,提到一个完整的机器学习模型或者说产品的故事:
总的来说,就是领域专家定义问题,预测结果和行为;数据科学家根据问题对数据进行梳理和分析,选取模型或者自训练模型解释数据;AI专家对模型的精度和性能进行研究和提升。
原作者解释,三个专家,时常身份重叠。因此我初步诞生了我的定位和方向:我想成为三个专家,没错,三个。
做什么
首先我们借鉴机器学习的一个重要计算方式:反向累积/反向传递,进行一个梳理,有了明确的目标,就能够推导接下来我该怎么办了。
1.领域专家
对领域的熟悉不是一朝一夕能够练就的。大概和每个实验室都有自己独特的实验配方和技巧一样,领域的掌握不是一两天可以说完的。我正处在转方向的关键时期,博士的毕业后虽然确实可以改变方向,但是随着对领域的理解不断深入,作出成果的可能性越高,也更容易出彩。
我想我博士就应该选择一个自己已经有一定了解,并且真的非常感兴趣、有前景的领域,并且坚持在这个领域做下去,我选择人体疾病。接下来2-3个月,我会重点去了解肿瘤领域的基础知识和前沿信息,一旦进入肿瘤领域,这个全世界最聪明最优秀的医学工作者扎堆的地方,拼命就是一种必然。
2.数据科学家
说到这个问题,我就知道,该来的总会来的。统计学、数学必须好好学,一个优秀的数据科学家不是单纯的会跑脚本,会写程序就结束了,必须了解背后的算法以及数学意义,它的理论。
3.AI专家
说实在的,我大言不惭地说自己相当三个领域的专家时,并不是相做一个在每个领域都能对所有知识如数家珍的人。生物我就只研究肿瘤,数据科学我就针对于测序数据和生物系统数据,而AI,我想针对神经网络或者更小一些的范畴——RNN、GNN或者CNN。
怎么做
一年为限
时间段 | 任务内容 | 目标 |
---|---|---|
1-2月 | R语言基础和进阶 | 达到写包的水平 |
1-2月 | GNN和pytorch入门和应用 | 熟练应用pytorch进行模型训练,入门GNN |
2-3月 | GNN和pytorch应用和研究计划 | 1.熟悉熟读生物领域应用Deep learning的文章;2.完善研究计划 |
4-6月 | 第二个项目 | 1.GNN实战,完成写作;2.备考GRE |
7月 | 考GRE和研究新项目 | 完成GRE考试 |
8月 | 新项目准备 | 新项目文献收集 |
9-12月 | 1.申请学校;2.完成第二个项目 | 申请北美和欧洲学校;完成第二个项目和投稿 |