作者:王鸿伟
链接:https://www.zhihu.com/question/315337121/answer/627502932
这其实是一个很值得思考的问题。一般而言,一次科研的流程图是这样的:
当你发现现有方法存在可以改进的地方之后,你就要提出你的新模型了。有了新模型,你可以走application的路线:写代码 -> 跑实验 -> 调参数,也可以走theory的路线:进行理论推导、证明性质、证明bound...在大部分情况下,一篇论文是model、theory和application三者的结合,所以会有中间的交叉虚线的存在。你可能会在图中的循环部分一圈一圈地绕,不断地改进模型、改进实现、试图证明一些结论,最终诞生出一篇论文。
那么回到原问题:发论文是先有idea再做实验,还是先做实验再有idea?如果这里的idea指的是model,那么你肯定必须要先提出一个model,才能写代码和跑实验的(哪怕这个model是非常简单的、甚至是不work的)。如果这里的idea指的是theory,那就要看你的论文是哪种风格的了。
其实,不管idea指的是什么,idea和实验都是在反复迭代中不断改进的。如果你过分强调其中任何一点都会有问题:如果你先开始考虑的是实验发现baseline的不足,然后在baseline上改进,发现实验效果好,然后就开始写论文,那么你的idea很可能创新性不足或者无理论保证(即heuristic),容易遭到审稿人攻击;如果你先开始考虑的就是酷炫的模型、漂亮的性质,那你的模型可能真的就不work,就是跑不过baseline。这其实也是大家现在搞机器学习碰到的一个尴尬的局面:花哨的模型不实用,有用的技巧却摆不上research的台面。不过,话说回来,一个即好看又好用的model本来就是广大researcher一辈子的追求。对于研究生而言,能做好其中一点,就已经非常不错了。
作者:令狐诗楠
链接:https://www.zhihu.com/question/315337121/answer/638608960
大概是这样的吧
真正的科研过程从来都是非线性进展的过程,尝试很多、但收获可能并不对等,不过idea和实验往往是螺旋式互相促进的,总需要有实验验证idea,idea又能从验证的实验中生发出来~
图转,侵删~
本文由mdnice多平台发布