第一个季度完成情况
上个季度的计划写的时候内容就很多,那时候又想补短板,把R语言进阶到写包水平,又刚好加入DAIR团队实习,有大量的深度学习工作要做。没想到自己能够基本完成,大概有7分努力,还算不错。
但是依然存在一些问题。细节做的不是很到位,GNN的学习欠缺火候,pytorch和理论算法有欠缺,接下来做项目肯定需要弥补,欠下的总得还。
总结一些经验
自学的部分R语言还算认真,但是神经网络由于涉及到大量的数学公式和计算机通信学的理论知识,所以自己也是囫囵吞枣。
后期正式开学后,张老师时常会关心我的学习收获和研究计划进展,这是一个很好的推动力,会推着自己不断努力去查找资料和完善计划,而不是在办公室一个人闷头低效率的苦干。所以非常感谢张老师。
DeepMeta项目
DeepMeta的实验设计从3月4日开始,一直持续到3月27日,差不多才初见雏形,各个环节也基本推敲过,比以前设计实验有进步。
但是仍有细节需要完善,包括:
- 模型的原始数据预处理
- 模型的比较
- 生物学上的验证
- 模型是否能优化
- 参数的优化和调整
其中我认为生物学上的验证和继续探索,更为重要,所以这个实验设计仍需努力,我计划一边做前期工作的时候,不断积累相关知识思考后期验证。
| 时间段 | 任务内容 | 目标 |
|---|---|---|
| 3月28日-4月3日,一周 | 细化和完善初步的研究计划 | 虽然计划是初步的,但是一定是很详细可执行的,验证部分也需要去思考 |
| 4月4日-4月17日,二周 | 完成数据的收集整理 | 写script批量收集数据,明确和执行数据的清洗和过滤细节 |
| 4月18日-4月30日,二周 | 完成数据的preprocessing | 生成模型input前的pan-cancer matrix |
| 5月1日-5月15日,二周 | 建模的预处理 | 生成图结构的三个矩阵,明确模型代码 |
| 5月16日-5月29日,二周 | 正式跑模型 | 研究模型的优化和perfromance |
| 3月28日-5月29日 | 线程2:思考模型的延展问题,发什么期刊 | 怎样把问题深入到生物学问题里,寻求验证。co-expression?WGCNA或是其它? |
| 5月30日-6月5日,一周 | 模型验证 | validation和robustness |
| 6月6日-6月19日,两周 | 完成生物学问题的扣题分析 | 梳理更深入的生物学问题 |
| 6月20日-6月30日,10天 | 完成初稿 | 开始投稿 |
预估第三季度计划
CUHK如果去不了,8月份要考一次GRE,GRE一般的准备时间为3-4个月,所以我4月就要开始准备,但是和研究计划冲突了,还是先保证项目再考虑GRE。试试抓紧时间push进度,6月开始准备2-3个月试试,4月份开始每天做完项目就开始背单词。
完成这个项目之后开始进入新一轮的申请,陶瓷联系香港、新加坡、欧洲等地不需要GRE成绩的地方。
如果确定了CUHK,也要把这个项目做完,挂名哪里需要沟通但是问题不大。争取7月份到HK,第三季度开始新的项目,于此同时投稿修稿。新的项目思路是有前端的数据挖掘生信分析+模型+验证,目标是1区7分以上文章,为期一年。