今天(2020.03.08)听了清华大学计算机系刘洋老师的报告——《浅谈研究生学位论文选题方法》(原视频链接在👉这里),获益匪浅,对如今大四且后半年要成为计算机领域的硕士有非常深刻的启发与指导意义。(要是早半年看到这种报告就更好了,也会少走很多弯路,💔)
在这里整理一下报告的主要内容,供以后自己选题没有思路的时候参考,也希望能对看到文章的你有所帮助。
本文目录:
一、硕士学位要求
二、选题的重要性
三、科研三观
四、选题——选择研究问题 [干货]
五、总结
一、硕士学位要求
原视频有博士论文要求,这里我没有写。
学位论文:为获得学位而撰写的科学论文
论文要求
- 掌握坚实的基础理论和系统的专门知识
- 具有独立从事科学研究工作或独立担负专门技术工作的能力
培养要求
- 第一年:课程学习;了解本学科基础知识
- 第二年:选定学位论文研究题目;开展研究工作
- 第三年:学位论文答辩
二、选题的重要性
选定学位论文题目是战略性的重大决策。“男怕入错行,女错嫁错郎。”
选题不仅是当下的任务,未来进入工作,比如大学老师,或者企业研究单位,可能还是要继续这个研究题目。因此选题是至关重要的。
三、科研三观
1. 科研三观对选题而言又至关重要。
- 世界观
学术界的发展规律是什么?认识到学术界科研界是什么?这个世界的游戏规则是什么? - 人生观
研究生阶段要实现的目标是什么?毕业以后要干什么,是这个阶段要想清楚的。 - 价值观
什么样的科学研究是有价值的?有人认为能毕业找工作就行,有人认为能为人类发展做贡献,有人认为能为国家社会做贡献。
如果一个人“三观”很局限,就很难选到很高大上的题目。
2. 应该树立怎么样的三观?
- 世界观:推陈出新,创新至上
- 人生观:追求卓越,锻炼能力
- 价值观:创造知识,服务国家
做科研很大程度上取决于你的努力程度,你的努力上限就可以说你取得成果的上限。
虽然每个人读完的目标不同,但研究生阶段可以看作一个人从大学到社会的过渡期,应该追求卓越,提高能力,并带到社会工作上去。
四、选题——选择研究问题
(一)学会提问
The important thing is not to stop questioning. Curiosity has its own reason for existing.
--Albert Einstein
科学研究围绕提出问题和回答问题展开的。提问是创新的来源。
很多时候会应该压力大等因素而丧失掉初心,但是仍希望能够保持较大好奇心,这样才给研究不断提供驱动力。
(二)评价研究问题的标准
1. 重要性
学科发展主脉络
If you do not work on an important problem, it is unlikely you will do important work.
--Richard Hamming
例如:人工智能发展脉络:有高峰也有低谷。
做研究应该选择重要问题,即尽可能在学科发展的主脉络上的关键问题,不建议在一些细枝末节的小问题上投入很多精力,可能做的很好,但很难对学科发展产生很重要的影响。
重要的问题:悬而未决的重要挑战,制约发展的关键瓶颈
2. 创新性
研究问题应该突破人类知识边界,创造新的知识。
(这个图大家应该都很熟悉了)
3. 前沿性
抓住合适的机遇,同努力工作一样重要。站在风口上,猪都能飞起来。
--雷军
判断该问题当前在本学科发展大潮的位置。
研究的关注度和成熟度可以用下面这张图表示👇:
- 超一流学者会做一些关注度低、成熟度低的工作,但在5-10年以后成为主流工作,但风险很高。
- 一流学者会做一些比较热门,可能发展好的一些工作。
- 二流学者会做一些目前最热门的问题和工作。
- 三流学者会做已经成熟的工作。
- 末流学者......
例子:计算机领域一些重要模型的发展,可以看出来上面所讲的规律。最开始DL(Deep Learning)在2000年不被关注,但是到2010-2020年间又大火了,成为研究主流。但是现在研究的什么东西在未来会大火我们是不知道的。
判断当前时间点该问题落在哪个区域,是非常重要的一个能力。
4. 探索性
评估目前问题的解决程度和未来可能的创新空间。
判定当前研究问题的解决程度:完全解决?解决的很好?解决了一半?没解决?有多大空间能让人施展手脚?
5. 基础性
该问题对本学科和相关学科能产生广泛深远影响。
将研究比作一棵树,选择的问题应尽可能在根上或主干上,这样后面研究的枝叶都会受到你的影响。
直接体现为文章引用量高。比如:优化算法在人工智能领域很常用,好的优化算法将会产生很深远的影响。
6. 复杂性
该问题有足够的体量,能够拆分成若干个创新点。
大问题要能够做3-5年,不能是一眼看穿的问题。一般每个创新点对应到一篇发表的论文。
博士论文一般三个以上,硕士论文一般一个或两个。
7. 系统性
各个子问题之间密切关联、有机衔接、浑然一体。比如A影响B,B影响C这种。
有的论文中有“XX方向若干问题研究”,这种一般子问题是割裂开来的,不好。
一般要选好题后,能够预想到三年内要做哪几个子问题,还要保证子问题不过时。这很困难,但也很重要。
8. 可行性
We do not work on (1)time travel, (2)teleportation, and (3)antigravity. They are not important problems because we do not have an attack. It is not the consequence that makes a problem important, it is that you have a reasonable attack.
--Richard Hamming
该问题应该具备在短期内解决的可能性。把风险降到最低。
做科研可以开始雄心勃勃,但起步一定要能够拆解成可解决的问题。千里之行始于足下。这样一步一步来,达到最后大问题的解决。
9. 承接性
课题组有良好的工作积累,能够提供最大的助力。站在巨人的肩膀上,我们也要站在课题组的肩膀上。
但这一点不是非常关键和必要的,科研更重要的还是看个人的决心和努力。
10. 适合性
成功取决于能否将自己的特长发挥到极致。
自己对该问题感兴趣,能够充分发挥自己的优势。
找到自己的passion能够每天都保持斗志昂扬的状态很重要。
(三)如何进行选题
干货来啦!!!
【我觉得听到这里是最让我眼前一亮的!!!做科研居然还可以用军事战略性的话语解释,刘洋老师太厉害了!】
这段话来源于《中国革命战争的战略问题》,是毛泽东 1936 年 12 月在延安的中国抗日红军大学的一次演讲。将毛主席的话用到科研中也是一样的!
做研究要有一些战略性的思考,这往往是大家所欠缺的。往往很多人入门科研后,就是导师给了题目、论文后就开始读论文了,缺少顶层上的设计与布局。
总结出做科研选题的关键的三点——调研,思索,判断
1. 文献调研
Many researchers spend more than half their time reading.
--How to do Research at the MIT AI Lab
许多研究者花费超过一半以上的时间来进行阅读。【这篇英文的原版文章在👉这里,中文简介版在👉这里。有空还是要仔细研读一下。】
(1)等同于军事作战中的侦查
勤读文献,及时更新知识结构,站在领域前沿。很多人有一个很大的问题:读文章很少,读了几篇就开始编程,编程实验开始了就不看论文了(这不就是我吗!!!以后一定要避免做实验放弃看论文的坏习惯!!!),这会导致知识结构比较陈旧,不知道领域前沿现在发生了什么。
(2)来源
经典著作、期刊杂志、会议文集、学者主页、社交媒体、预印网站。
但要兼顾时效与质量的平衡!
阅读过程中,六个来源都要覆盖到,但要做好平衡。既要学到高质量的知识,同时要保持自己站在领域前沿,否则不知道大潮最前端在哪里。
-
经典著作:
对于经典著作,要每本书读三遍!!!才会达到对书中知识理所当然的境界!!!
The first tine you barely understand, the second time you start to get it, and the third time it all seems obvious.
-
期刊杂志
注意阅读领域外的期刊杂志,学科交叉容易产生创新。视野更加开阔,容易想到更好的想法。
-
会议文集
会议论文时效性高,质量上乘,是最佳平衡点。阅读量要比以前大。
-
学者主页
大家经常忽视。及时了解本学科顶级学者目前正在研究的问题。入门的时候,一定要关注你的领域前沿学者正在做什么。
好处:
(1)看别人正在做的项目,为自己选题、方法拓展新思路
(2)看到不懂的内容,可能是你的知识盲点,要及时去了解、弥补。
(3)帮你站到前沿。例如:麻省理工CSAI Lab发布的项目👇看前沿性工作可以提供很好的思路。
-
社交媒体
各大公司有blog,Twitter,BBS等,比论文发表要早,更早知道新的发展情况。抢先很重要。
-
预印网站
时效性最强,比正式论文发表出来早,但论文质量参差不齐。
(3)粗读与精读
信息爆炸,要合理平衡粗读与精读。
不用读那么多,但一定要找到该读的文章。
可能 80% 的论文只要看论文标题就行,只需要有一个印象,回头遇到了某些问题再找出来就行。因为只需要阅读 20% 的论文,差不多就能获得 80% 所需的信息,所以后面重要的一步就是加深我们对这些知识与研究成果的思考。
对于如何找到那部分该详读的 1%,我们可以把读论文看作是一个漏斗的形状,我们先看 80% 的论文标题,再看 20% 论文的摘要,这样最后「漏出来」1% 的论文就需要搞懂全部细节了。这是一个自然的筛选过程,而不是直接选定那 1% 的文章。
2. 读完后——深入思考【很关键】
思考的目标:构建知识体系,加深理解程度,形成个人观点。
文章之间是有一定联系,要看到这些联系。更重要的是要形成自己的体系、自己的观点(正是我现在缺少的呀!!!😭未来要加油了!!!)
想象一下,我们的知识体系就是一个知识图谱,每篇论文是一个节点,不同节点之间可能存在连接,这些连接表示论文之间的联系。可能某些节点的边非常多,这表明由它延伸的研究非常多,它们就是关键论文。可以找导师、学长询问某领域的必读论文,并把它们作为入口。一般而言,论文的阅读顺序可以表示为:必读论文、领域先驱发表的论文、前沿论文。
读论文要像毛主席说的:去粗取精、去伪存真、由此及彼、由表及里。
3. 判断
(1)独立性
坚持独立自主,有自己的观点,不要把希望寄托在别人身上,主动权在自己手上;但可以不断让别人提意见,不能太过于封闭。
一定要避免那种:导师让做什么做什么,别人说不work就不做了的状态。
既坚持独立思考,又保持开放性。
(2)勇气
One of the characteristics of successful scientists is having courage. Once you get your courage up and believe that you can do important problems, then you can. If you think you can't, almost surely you are not going to. --Richard Hamming
一定要不畏风险,有勇气去做具有挑战性的问题。
“高风险=高回报;高门槛=低竞争。”因为现在计算机领域竞争很激烈,全世界可能同时有1000人在和你做一样的问题。如果你想的是很low的idea,大家都能想到。因此要有勇气做别人不敢做的事情,这样竞争的人也少。具有挑战性的工作往往也最能推动学科发展。-
曲高和寡,领先于时代的人往往不被理解
- 比如玻尔兹曼:在世提出的一些工作不被人重视,甚至被抨击,最后得了抑郁症自杀。
- 比如提出神经网络、感知机的:提出的工作甚至被获得图灵奖的大佬批评,但现在却产生了深远影响。
(3)理性选择
通过量化实现理性选择研究题目。
下表给出了刘老师个人的权重设定,他认为重要性、创新性和前沿性这三个指标是特别重要的。候选1最后的综合得分最高,它代表着创新性与前沿性非常高,但同时风险也比较大;候选2与3表示更为平庸的一类研究主题,但它们非常安全,能保证做出成果。当然,下表的权重可因人而异。
五、总结
- 选择学位论文研究题目是研究生阶段的重大战略性决策,必须高度重视;而且要开始时想好,后期不要频繁换题目。它越早确定越好,同时确定了就不要更换,不然的话研究会更为紧凑且读研花的时间更长。
- 弄懂什么才是好的研究题目,通过充分的调研和思索,尽可能多找出候选题目。
- 独立思考,理性决策,有勇气选出有挑战性的研究题目
其他
时间管理
研究生阶段:学习知识和创造知识,尽可能多的留给创造知识,但学习知识过程要保证MIT提到的50%阅读量。-
先读文献再想idea还是先有idea再看文章——没有优劣,都可以采取
- 有的人是在看文章的过程中保持批判性思维,看了100篇左右想到新的idea
- 王选做法:拿到问题先自己想自己的解决办法,这样的好处是会保持高度独立性,不会受到千人工作的束缚。再读文献的时候会和前人工作来思维的碰撞,哪些别人做得比我好,哪些别人没做过等。