首先,一轮研究过程包含:
1. 找一个有新意、有潜力影响力高的课题
2. 找一个候选解决方案。构成一套 “课题-方案” 的假说
3. 针对每个假说,开始理论或者实证分析
4. 如果结果成功证明或者推翻假说,完成;反之,从2继续
最初的解决方法可能非常简易,你极有可能会失败--也许是问题太难,亦或这个方法解决不了问题。注意,由于大多数论文只会展现积极的结果,你可能会意识到一些方法实际上并不是解决该问题的好方法。在科研中,我们几乎总是在微调我们最初的假说,想让它的结果有用。找到合适的课题,建立、改进最合适的方案,是一个非常复杂的有创造性的过程。所以我们很难精准量化这个过程。
JIM GRAY'S CRITERIA
很多学生认为科研事一个令人羡慕的事业,可以让人名留青史。看看你的课本,牛顿、伽利略、爱因斯坦...但是,对于一个低年级博士生,科研应该既是一场充满好奇的冒险,也是一个严肃的职业。
讲个有趣的故事。一个叫做Yang的学生,曾经上过Charles Townes (诺贝尔物理学奖获得者,研究量子电子学激光和微波激射器)教授的某课。Yang早些年刚从北京大学毕业时见过他,那是Townes教授第一次访问中国(1982年代表Jimmy Carter总统访华的一项科研任务)。在学术讨论会上,Townes教授讲述了他第一次关于一条鱼的发现的乐趣。他说,小时候喜欢抓鱼。一天,他抓了一条百科全书上没有的鱼。出于好奇,他给Smithsonian Institute 博物馆写了封信。收到回复是,他非常惊喜,回复里说“恭喜你,Townes先生,你发现了一个新物种!” 想象一下当时还是小男孩的他有多激动多开心!
Discovery is a childhood joy.
一个人进入某研究领域,最初普遍是因为创新和发现让他有成就感。我们小时候都有过这种梦想。我们想说的是,在对某个研究领域进行职业规划时,我们不能只是出于好奇,得有一个对待科研像对待一场生意一样的过程。 (本人认为这一大段都是废话,不翻译了。说实话,这个例子想表达什么非常不清晰。小时候的新发现的成就感在科研中很重要?那这跟 “应该像经营生意一样经营科研”有什么关系????)
一旦我们知道我们主动想做某项研究时,第一个任务是决定深入探究的方向和目标。
This process will definitely be curiosity driven, but should also follow a well-managed process.
前几篇提到过,找到一个好的课题有很多要素:和同领域的专家讨论,尝试发一轮文章来测试自己的工作有无意义等。但是,如果你对几个科研领域差不多感兴趣,应该选哪个呢?成功的人怎么做选择的?为什么一些天资相差无几的人在科研的成果上相差甚远?
在我们博士生涯里,我们一直在讨论或者听说一些“成功的”研究者。已故计算机科学家,图灵奖获得者,JIM GRAY,总结了一系列最著名的‘高影响力的科研’标准:
1. have clear benefit | 有明确的优点
2. be simple to state | 用简明的话来阐述
3. have no obvious solution | 不用显而易见的解决方案
4. have a criterion where progress and solutions are testable, and where it is possible to break the larger problem down into smaller steps, so that one can see intermediate progress after each step. | 制定一个标准--进展和解决方案在哪里可以测试,在哪里可以把大问题分解成更小的步骤 (人们可以看到每一步的阶段性成果)
假设一个学生对于文字处理技术非常感兴趣。这项技术有非常明确的优点,也可以用简明的话来表述。但是,如今,这项技术已经变得很容易做到了,且有多种文字处理软件供选择。所以,这项科研是缺乏影响力的,除非在现有的文字处理软件上做出巨大创新。
但是,假设一个学生提出了一项关于语音输入的新型文字处理系统。前两项满足。但是,以当下的技术还远远没有达到一个文件的语音识别系统的程度。所以关于第三项,解决方法还不够显而易见,不够准确。研究成果是可测试的:请一些人对麦克风说出一些连贯的清晰的语句。最后,大目标可以被分解成一些小的步骤,包括 phoneme recognition, sentence recognition, grammatical analysis, and fault tolerant, 等等。所以,这个课题可以说是一个有价值的科研方向。
剩下的还是一些例子,对于不同类型的学生怎么实施这个系列标准。
The research matrix method
对于第四个标准,一个最有效的方法是科研矩阵。
图一是科研矩阵的示意图。横轴表现了不同的方法论和技术,纵轴列出潜在的待解决的问题。一些小问题是互相关联的,应该按顺序解决;另一些问题可以同时进行。
更具体地说,我们试想一个学生对机器学习和数据挖掘领域很感兴趣。假设这个学生想从事cost-sensitive learning 相关的工作。 Cost-sensitive learning 考虑的是怎么建立以基于计算机的模型,通过考虑模型本身在未来的不同种类的错误的相关成本来改进自身。这是一个非常重要的领域,因为很多实际的机器学习问题本质上是cost-sensitive, 其中数据是不平衡的。
一个好的开端是先做一个广泛的的调查。假设这个学生已经把课题分解成几个小问题:cost-sensitive learning when the costs are known (成本已知), cost-sensitive learning when costs are unknown ahead of time(成本未知), cost-sensitive learning when the cost is associated with missing data acquisition(成本与数据获取缺失相关), and cost-sensitive learning when data comes in stream form (实时数据流)。 那么在方法轴,我们可以铺开一些解决方法,比如贝叶斯分类, 集成方法,密度比方法,以及分割或者基于树的方法。接着,我们可以列出不同的在线学习方法。
在这个科研矩阵中,这名学生可以首先用已读的参考文献填满一些格子,每个代号代表一篇论文。他可以选择在格子里做笔记,写出论文的优缺点。你会发现,有的格子是空白的,比如第二列和第四行,以及(3,3)。这说明第二种方法还没有人把它用在这个课题上,第四个问题还没有被列出的任何方法解决。而(3,3)无疑是一个很好的研究点,因为你的成果可能会对一个重要的具体问题提出一个创新性的解决方法。
个人认为这个方法很有用!