arxiv上搜论文的技巧

免费知识哪里来——Arxiv使用指南

4.1 如何用人工智能帮你找论文?

介绍arxiv.org的文献更新管理工具arxiv-sanity

如何学会看arxiv.org才能不错过自己研究领域的最新论文?

如何学会看arxiv.org才能不错过自己研究领域的最新论文?

1 什么是arxiv-sanity

我们都知道arxiv.org是一个非常大的预印本资源库,里面有大量的最新的论文,但缺点是浏览、搜索和排序不是很方便。这个库每天会更新大量的论文,如果只是通过手动搜索和浏览效率就太低了。

image

这样特别容易让人和一些优秀的有趣儿的论文擦肩而过,这些论文可能是和你的研究领域相关的。所以接下来你可能就能猜到这个arxiv-sanity是干什么用的了,它是一个机遇arxiv的论文检索系统。

网址为:http://www.arxiv-sanity.com/

2 arxiv-sanity的基本功能

1、便捷的预览

首先,arxiv-sanity在展示最新更新的文献时,提供了可读性更强的缩略图预览模式方便读者来快速预览,并在缩略图下方的绿色区域显示文献的abstract 。

image

2.感兴趣相关度排序(show similar)

更重要的是,它可以让你根据自己的阅读兴趣对文献进行重新排序。比如这里有一篇关于对人体姿态估计的文献是你感兴趣的,点击右上角的' rank by tf-idf similarity to this',文献列表会按照与这篇文章的相关度进行排序,接下来我们会看到arxiv上所有关于人体姿态识别的论文。这个功能是基于TF-DF算法来实现的,效果很好。(一种文档特征提取法,它是由Salton在1988 年提出。其中TF称为词频, IDF称为反文档频率, 感兴趣的可以自己百度。)

3.个人图书馆(library)

如果你是注册用户,在登录账户之后,还可以把自己感兴趣的文献收藏到你的个人图书馆。比如,我喜欢上图的这篇人体姿态估计的文献,点击右上角存盘图标,(看到了吗?就在' rank by tf-idf similarity to this'下面),点击之后就把这篇文献存在我自己的library里面了。

image

这时,刚刚黑色的图标变成了蓝色,点击上面的library标签,可以看到它出现在了最上方。你可以像这样收藏很多自己感兴趣的文献。想删除的时候,在自己的library里面再次点击那个图标就可以删除了。

4.感兴趣推荐系统(recommend)

另外,library不光是用来收藏和跟进自己领域的论文更新进度,arxiv-sanity可以通过你收藏的内容给你推荐你也许会感兴趣的论文。具体怎么实现的呢?library内部的论文会被标记为positive,Library之外的论文标记为negative,然后arxiv-sanity基于bigram文本特征提取来训练你的personal SVM,然后在reconmmended 标签里推荐给你。点击recommended标签你就可以看到最近两周arxiv-sanity认为你会感兴趣的文献。当然,你也可以通过设置时间来自己筛选,如去年,上个月,上周,昨天和全部,看看自己有没有错过什么文献。

image

5.看看大家都在看什么(top recent)(可以通过控制时间来看段时间收到关注的文章)

最后,再介绍一下“top recent”标签。这里面展示的是arxiv-sanity上被用户收藏最多的文献。这些文献也可以按照时间来筛选。即使你不是注册用户,你也可以浏览到大家都在收藏的文献。

6.网站代码开源

image

在页面上方可以看到,arxiv-sanity只展示machine learning的论文,如CV,CL等ML的分支领域,因为这是arxiv-sanity作者自己的研究领域。(对,这是人家闲暇时间写的)。作者已经把arxiv-sanity开源了,所以如果你想根据自己的研究领域新建自己的arxiv-sanity,可以去GitHub自己fork。GitHub搜索 karpathy/arxiv-sanity-preserver。

7.系统还和社交媒体平台Twitter链接了起来(top hype)(最受宣传的)

图片.png

里面有大佬在推特上对文章的评论。

8. 下载使用kopernio 插件
这个插件可以在火狐和chrome上使用,可以不用下载pdf,直接在线阅读arxiv上需要下载才能读的文章,个人感觉比较好用,省去了下载很多可能没有必要下载的文章,然后占内存的麻烦!

各分支领域缩写翻译如下:

cs.CV:Computer Vision and Pattern Recognition 计算机视觉与模式识别;

cs.CL:Computation and Language 计算语言学;

cs.LG:Learning 机器学习(计算机科学);

cs.AI:Artificial Intelligence 人工智能;

cs.NE:Neural and Evolutionary Computing 神经与演化计算;

stat.ML:Machine Learning 机器学习(统计学)。

好了,就是这样,赶快用起来吧。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。