吴恩达建议,研读一篇论文需要读三遍
第一遍:读标题、摘要和图片。
第二遍:读引言和结论部分,再浏览一遍图片,并快速浏览论文的其他部分。
第三遍:阅读论文的全部内容,跳过你不熟悉的复杂数学或技术公式。这一遍阅读时,你还可以跳过不理解或不熟悉的专业术语。
张俊林:拉马努金式思维训练法
尽量用最少的论文内容(标题→摘要→结构图)脑补如下的信息,比对真正的做法有什么异同
要解决的问题:
大的方法框架:
具体任务流程:
创新点和想法:
阅读的paper: Distributed representations of words and phrases and their compositionality
解决的问题:对Skip-gram进行扩展,提升了训练速度和embeding vector的质量。
思路框架:Subsampling of frequent words、Negative sampling、Phrase Embedding
具体方法: Subsampling主要的目标就是将高频的词剔除,因为高频词带来的信息量较小,所以将其剔除节约计算资源。Negative sampling是从负样本(噪声)中采样,。是从NCE简化而来,NCE的作用是使模型能区分数据和噪声,替代了分层 softmax,理由是后者的树结构对性能影响很大, Phrase Embedding就是把常见的词组作为一个单词,所以更合理的是把“Boston Globe“看成一个单词,有他自己的word vector。
创新点和想法:有3个创新点:
1.把常见的词组作为一个单词 (Phrase Embedding)。
2.少采样常见的词 (Subsampling of frequent words)
3.修改优化目标函数,这个策略称之为“Negative Sampling(负采样)“,使得每个训练样本只去更新模型中一小部分的weights。
华刚:带着十个问题看论文
这篇文章究竟讲了什么问题?比方说你设计一个算法,它的 input 和 output 是什么?
这个问题的性质是什么?是一个新的问题吗?如果是一个新问题,它的重要性何在?如果不完全是一个新问题,那为什么它“仍然重要”?
这篇文章致力于证明什么假设?接受过深度科研训练的人都知道所有研究其实都是从科学假设开始的。从 12 年开始,计算机视觉领域的很多研究员认为这是一门实证科学(experimental science),即需要提出假说并通过实验去验证。
有哪些与这篇文章相关的研究?这一领域有哪些关键人物?
这篇文章提出的问题解决方案中,核心贡献是什么?
实验是如何设计的?计算机视觉研究中,实验设计的重要性不言而喻。但在写 paper 的过程中,实验的表现不是最重要的,关键是如何通过实验去支撑每个假说。
实验是在什么样的数据集基础上运行的?科学研究结果应当是可以量化、可以复现的,读文章的人是否能接触到文中所用的数据集?
实验结果能否有力地支持假设?如果一篇文章提出的假设并没有被实验或者理论完美支撑的话,多半不是一篇好的文章。
这篇文章的贡献是什么?回答了前面 8 个问题之后,第9个问题的答案也呼之欲出了。你应当试着用自己的语言总结出来。
下一步可以做什么?这是非常关键的一个问题,也决定了你今后能否在科研领域获得成功。在这篇文章的基础上,我们接下来能做什么?应该做什么?在科学研究的初期,导师会给你方向上的指导,但作为一名独立的研究员,你应该独立地回答这个问题。