最近听了北京智源论坛举办的学术论文写作分享会,重点总结了兰艳艳老师和赵鑫老师的分享。他们的报告对作为一名学术小白的我有很深的启发,也为后面我的学习和研究提供了一些建议和帮助。先🐴着,后面随时复习!视频链接
一、Introduction
(一)论文最重要的——逻辑
3W2H写作法(这部分是兰老师的分享,但赵老师也有强调,后面大部分都是赵老师的分享)
- why最重要
告诉别人你的工作很必要,审稿人才会看下去,写文章之前要想清楚 - What
做的事情是值得大家看,写文章之前要梳理出来;新颖性、深度 - How-Detail
你的工作厉害在哪里,要写出了 - How Much
我的实验效果、和其他工作有什么关系等 - What Then
我的事情总结起来是什么状况、能对别的工作有什么启发
论文中最重要的是3W。2H好只能体现文章写得清楚,但是3W更能体现工作的价值。写论文是在整理思路,实际上是在整理3W。
【建议】多写draft-写出来3W2H。建议平时做研究工作时写出来,能够不断从全局审视目前研究工作是否到位,不断补充、改进,避免陷入实验的detail而忽视很多其他重要的东西。
(二)常见逻辑错误
- “因为模型A好使,所以拿A去做某任务”,这是很常见的问题。
- “这个任务没人做,所以我做了”,这一点也很霸道,毕竟世上没人做过的事情有很多。
- “之前的人做了什么工作,我做了什么工作,我的好”,这种写作也非常霸道,没有给人一丁点儿代入感,会让reviewer非常不爽
- “夸大自己模型的贡献、忽略别人的工作”极有可能导致论文被拒,千万不能夸大!
(三) 论文中的“度”——包装需要,但是要适宜
科研过程要有一个推进,你现在可能觉得这个技术不怎么样,但是你可能需要持续的去发力。那么你要发力的一种形式,就是论文,当然其他形式也有。如果说你不想让你的论文成为垃圾,一定要把你的贡献说得很清楚。
其中一个问题就是包装一定要适度,不要过度包装,过度包装是对学术的很大的一个不尊重。有些度可能你自己都没有注意到。
常见包装过度的问题:
- 随意给出一些非常主观的意见,连个引用都不加。
- 随意使用一些特别普遍的词汇,比如knowledge,context、Information。在用这三个词的时候,先问问自己知道是什么意思吗?能不能用一句话去定义这三个词?
- 另一个很容易犯的错误是随意夸大自己的模型,在写的时候一定检查一下副词、形容词,多用一些限定词,比如说:在什么样的任务,加上这个东西,效果会好一些。
(四)论文中的“铺垫”
引文的作用是吸引大家,最重要的是做一些铺垫。
- 要解释清楚主要术语。比如说有的同学在做knowledge-aware,但是从头到尾都没有解释过什么叫knowledge-aware,这就非常有问题。
- 然后一定要解释清楚模型的主要的设计、思路、技术路线。
- 但也不能太细,一些调参细节就不用介绍了。
- 最重要的是不要把方法说的云里雾里,要让你的同行室友能够看懂模型。所以,最好的方法是把你室友拉过来,然后让他看一段英文,你问他能不能看懂,他如果看不懂,你赶快把那自己那段话重新写一下。
- 画图、举例子
- 最后还要强调一点,突出主要的创新之处,需要写出一句到两句非常中肯,学术的话来总结自己的贡献、创新点。这是非常关键的,要能用1-3句话说清楚自己的idea。
- 小tip:这种话一般要放到论文中很显眼的位置。
(五)初学者写法
可能对初学者有帮助。
写完这6句话之后,你在做什么事情就能很清楚了,如果能把这6句话写好,其实你基本上已经把引文给写好了。
(六)过渡词
过渡词使用很重要,建议大家把每一个词是什么意义,自己去查一下。常见过渡词有:Yet、Although 、Though、However、Still、While、Because、Since、And、But等。
(七)学会“讲故事”
写作是一门讲故事的艺术,要让别人听懂,这是也是义务,这并不是说包装。如果你的东西你别人都看不懂,听不懂,你的东西,再好有什么用呢?因为你没有办法给别人带来收益。
1、一篇期望的引文的特点(逐渐递增)
- 让读过的人知道你在做什么。
- 让人觉得你的工作是重要的。
- 让别人觉得你的思路就是和别人不一样,如果能给人耳目一新的感觉,那么论文很可能被接收。
- 让人觉得你的工作不可或缺
- 最后一境界是让人读起来如沐春风(这个很难)。
2、把握节奏,节奏感是达到状态的灵魂。
总体来说,引文写作节奏是:首先要交代背景,让人进入你的工作;紧接着铺垫包袱,说清楚你要做的事,你要解决的挑战是什么;然后最后要转回来,带入细节的解析,让读者知道你是怎么做的。
交代背景(入),铺垫包袱(难),谜底揭晓(奇),细节解析(懂),重点总结(收)
二、Related Work
(一) 尽量覆盖相关工作
相关工作的写法是首先必须覆盖所有的相关工作,这点很重要,在于平时的积累。
- 【阅读】平时阅读文献一定要分类整理,不要简单的罗列“A做了什么,B做了什么”,重在总结。还要突出相关,强调不同。
- 【写论文】在写相关工作的时候,东西一定会很多,所以归类整理的时候,要配上一些排版的style,该加粗的加粗,该黑体的黑体,要让评审或者其他读者读起来很舒适。长度要控制:什么时候长写,什么时候短写要注意。在相关工作中还有一个高水平的写法是给某一类方法起简称,比如用开头字母代替等等。
(二) 常见错误
上面一些错误要坚决避免掉
- 在介绍相关工作的时候,一定要写清楚他们与你之间的相关联系,
- 还有英语时态问题,可以用过去时,也可以用现在完成时,但是别混着来,混着来会给人非常不专业的感觉。
- 引文写作错误,充当主语怎么写之类的要清楚。[13]不能做主语等。多学习模板里的写法。
三、 定义
(一)符号规范
书写符号总结起来有三点:好看、好记、成体系
在介绍术语的时候,其实就是把概念带入进去,特别建议所用的符号符合人的直觉——首字母法(用英文单词的首字母,因为首字母容易联想)。另外,符号和意义不要差距太远。
两个关键点:
- 符号符合人的思维
- 活用上下标
建议去看看《花书》,然后参考一下标量、矩阵、向量的表示方法。
(二)常见问题
- 一个字母代表多个不同的意义,比如有时候代表索引,有时候又代表上下标,有时候我也犯了这样的问题,所以建议大家把论文打印出来之后,一定要反复检查:是不是有一个符号。
- 未加粗,分不清矢量标量
- 符号不按习惯使用
- 频繁使用一些单词的缩写,频繁使用上下角标都存在的符号都会让人对你的论文抓狂,要少用
- 符号数量多
- 专有的LaTeX方法,比如log有LaTeX方法\log
四、模型
(一) 模式
1、总-分式
总分在于表明模型有若干个部分,分别介绍每个部分,这样主题比较清楚。
2、总-基础-增强
建议大家把小标题都好好检查一下,小标题如果连起来能够把模型说清楚,是很重要的关键因素。
(二) 最后的讨论会添彩
最后要收收尾的话,要写一些模型分析和模型训练、模型学习的方法。比如分析一下,总结一下之前方法怎么做的,然后和传统方法比起来又有不同的地方。
时间复杂度、完整的算法流程、参数汇总、模型可拓展的地方在最后都可以在模型最后讨论。如果有一些东西,你觉得可能是别人争论的地方,可扩展加上去(堵漏),说明模型有哪些地方没做好,怎么做就会把这个事情做好。
五、 实验
实验部分的一般流程包括介绍数据集合、评测指标、评测流程,还有主干的实验分析,还有模型的细致分析,还有定性的分析。
(一) 数据集合
在数据集合部分要讲清楚一点:论文中图表的数据是怎么来的?这个很关键,其他步骤可以忽略性或者有选择性去介绍,如果对当前工作不太重要,就别介绍了。
还有一个注意,就是说数字不要居中!因为当你有多个数据集的时候,居中不好判断数据集大小,可以靠右对齐,靠右对齐的好处是容易看出数据集的大小。当然,也可以用逗号表示法,这样非常容易帮助大家去认识数据有多少。
(二) 评测指标、评测流程
在评测指标和评测流程部分,新任务的评审指标要完全给出,并且要给得非常详细,那老任务你可以沿用,可以压缩。
(三) 对比方法
就是介绍baseline,可以比较简略,但是重要的参数要给出来。最后要加一些总结,让读者有一个整体的了解。
也可以用一个表,清晰的表达出哪些方法是新的,哪些方法是general。活用图表,研究人一定要反复要学的,包括以后做PPT,其实写硕士毕业论文也都是有用的。
(四) 主干实验
主干实验如何写?
- 主干实验一定要特别清楚做实验的目的,千万不要流水账。要强调做实验的目的是什么?做实验的目的就是要突出方法好,这点是非常重要。
- 常见的错误写法是有五种方法,A比B好,B比C好,虽然这能支撑一个句子的长度,但是效果其实并不会很好,因为大家都是知道你所用一些方法的好处、
- 异常结果加以解释
- 如果你的模型达不到原始效果,也要好好分析一下,这点在深度学习时代特别常见。如果模型baseline正常,描述不描述问题都不大。但是如果达不到原始论文效果,要解释一下,不然评审会怀疑是不是没调好参数?是不是用的方法不对?
- 最后一定要加上统计性显著检验,确保提升是有效的,如果不加可能是压死论文的最后一根稻草。
(五) 细致性分析实验
在写主干实验的时候,最后要强调“我的方法”好,要说清楚我的方法好在哪里,不要笼统的说好10%、20%。这一步也是为后面写实验做铺垫。
所以,前面要有铺垫,比如写清楚“我猜测是两部分造成的”,然后下面才要做这个实验。一般来说,主实验完了,还有一个细致性的分析实验,要检查贡献的来源,要调一些参数等等。篇幅不要太长,写清楚就足够了。一般用半行或者一行就能介绍清楚一个变种的名字,学会缩写,给出一个整体的评论。
(六) 定性例子
1、例子的作用
- 【画图】在用定性的例子的时候,要善用图表,解释方法为什么会有效,你可能在论文的前面推到了一堆公式来表明你的模式是有效的,但是让review最快速的理解方法的有用性还是画图。
- 【例子】要说清楚模型的哪个方面好,模型不可能每个方面都好,要挑选一些例子来辅助解释。值得注意的是,模型所有的写作都是在做呼应,因为你引文地方埋下了伏笔,要用实验部分来验证伏笔。
- 【呼应】所有都是要呼应,呼应introduction的地方是实验结果,而最强的呼应处是例子,而图就是定性的例子,图的关键是能不能呼应论文的motivation,图画好了会让评审的老师非常舒服。
2、一般流程
- 定性部分不要探索式的描写,要有核心驱动进行描写
- 画好一个图——“一图胜千言”
- 要用好图的标题,标题一般要介绍各种符号、颜色以及整体场景的设置,不要让文本描述和图的标题大部分一样,要让双方各有分工。
- 一段清楚的描述写定性例子
- 首先写清楚目的
- 接着写清楚当前例子的整体故事
- 然后分解进关键部分
- 最后一句话带过,总结发现,然后说一句我的模型好
六、 摘要、结论
(一) 摘要
摘要如何写呢?在这无需太多的细节,不需要代入,讲清楚任务、方法和创新点就可以了。建议摘要最后写,已经在论文成型之后,一些句子已经成熟,功利的、暴力的做法是直接拿过来用。
(二) 总结
在总结部分,切记英文语法,可以用现在完成时,过去时,但不能混着用。这部分不用再打伏笔,总结一下具体任务,解决方案,实验结果,未来扩展即可。
七、其他
避免的问题
另外避免英语词汇习惯的错误用法,学会灵活运用英文动词。
八、 建议
1、一些零星的建议,琐碎但很有用!
2、学习写作的建议
3、期刊写作建议
4、多写Note!(很重要)
写Note可以梳理工作,锻炼逻辑。
多写数学推导的Note(写清楚说明你的逻辑是没有问题的)
九、学习
(兰老师的分享)
要有心去学习
- less is more:学会舍得。跳出来,以外人角度来看。与主体关系不大的点不要突出,可能会成为减分项。点要少,要被连成一条线。
- 复盘:非常非常非常重要!!!
把经验转化为能力。定期复盘,对于后面的学习有非常大的帮助