机器学习 — 如何阅读paper?

在今天的机器学习网课中,老师专门提到了“对于课上疑点的解惑方式”,除了课上提问,在课下有比如 查看老师推荐书籍(相关理论)、回看上课视频、查看相关论文(paper)、搜索引擎搜索疑惑点等不同解疑方式。其中,老师特地说明了一下要学会自己看paper的方式。正好前段时间在007社群中也看到了有群友提到了Paul N. Edwards的《How to Read a Book》这本书,就结合起来简单总结下。

怎样从一本书或文章中学到更多?

从头读到尾的读一本书会很有满足感,比如情节引人入胜的小说。但是有许多书、文章和文档,它们不是小说:它们没有虚构。教科书,手册,期刊论文,历史文献,学术研究,诸如此类都属于非虚构类知识。

阅读这些非虚构类知识的目的,是为了获取并记住其中的信息。找出讲什么(而且是尽可能快速和容易地),这是阅读这些内容的首要目标。所以一个好的建议是:永远不要从头到尾的读非虚构类书籍

阅读一篇机器学习Paper的方式

从零开始,指的是我们要从零了解这篇文章做了什么事情、使用了什么方法、得到什么结果,这样的方法和结果对我有没有什么借鉴。而不是说,接触到一个全新的领域,从读论文开始入手。对于没有过接触的陌生领域。我的方法是,先看中文综述,中文博士论文,而后是英文综述。通过中文综述,可以首先了解这个领域的基本名词、实验常用方法。

否则直接从论文入手的话,作者站的高度和我们的水平不一致,很容易想当然的理解或者根本看不下去。因此,在阅读这篇文章之前,对于这篇文章中涉及到的基础知识,对应中文基础都理解透彻。这时,回归到从零开始理解这篇文章的状态。这里有3个递增的层次:

读懂这篇文章的概要信息(5-10分钟)
  • 认真读懂标题、摘要、简介(title, abstract, and introduction)。
  • 只读各个部分和子部分(section and sub-section)的标题,跳过具体内容。
  • 读懂结论和讨论(作者通常会在这里论述本研究的不足和缺失,为未来的研究提供建议,指明方向)。
  • 浏览参考文献,记下哪些文献是你已经读过的。
抓住文章的内容,忽略文章细节(1个小时)
  • 对图、表的含义以及他们支持的结论弄懂。
  • 记下参考文献中你认为重要的未读文献,它能让你对这篇文章的背景有深刻理解。

在这个层次中,如果遇到读不懂(原因有很多:公式太多、对术语不理解、对实验手段不熟悉、参考文献的文献过多)。说明我们还没有和作者在一个基础上,建议先从几篇重要的参考文献入手,补充背景知识。

深入细节理解文章(2-3小时)

如果这个文章是你想应用到目前工程中的,则需要这个层次,目标是能够在相同的假设条件下,重现(re-implement)论文。同时,要注重论文在GitHub上的对应代码,跳到程序中能加速理解。比较你重现的结果和原论文,就能真正理解一篇文章的创新点,以及它的隐含前提或假设。并且你能从重现过程中得到一些你未来工作的方向。

做这三个层次的好处就是,能够让你对读一篇文章的时间有合理的估计,甚至可以根据时间和你的工作需要调整掌握一篇文章的深度。

  参考:
* 《怎样读一本书V5.0 》(http://liujinkai.com/2017/02/08/how-to-read-a-book/)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容