今天,向大家分享一款重要的科研利器:文献引文分析软件HistCite。
在正式介绍之前,先说说我是如何接触到HistCite这款软件的。在我研一的时候,我意外地在网络上学习了中科大罗昭锋老师的课程《文献管理与信息分析》。可以说,这门课塑造和铸就了我现在的很多科研习惯和方法。这门课程主要介绍了三款文献管理与信息分析工具,分别是:
- 文献管理软件EndNote
- 文献引文分析软件HistCite
- 思维导图软件MindManager
之前,我已经在公众号多次介绍了EndNote。之前有粉丝在后台说能不能介绍个文献分析软件,这让我直接想到罗昭锋介绍的HistCite。因此,今天就全面介绍下如何使用HistCite,让它成为提高你科研效率的工具。
什么是HistCite
HistCite是汤森路透旗下的一款引文分析软件,基于Web of Science (WOS)数据库对文献引文进行分析。可是,长期以来官网对该款软件的更新并不是很积极(可能是因为WOS检索网站功能越来越丰富),导致该款软件有很多bug以及不兼容问题。至少在2016年,也就是罗昭锋老师在《文献管理与信息分析》课程中介绍的HistCite版本还只支持IE浏览器,并且有各种导入失败问题。
不过,HistCite的功能对科研人员来说还是有很大吸引力的。因此,在各大网友的开发和支持下,目前HistCite依旧活的很好,并涌现了一些非常好用的定制版HistCite。
那么,HistCite何以受科研人员青睐呢?
所谓文献引文分析,即通过分析某个领域的文献,计算出这些文献在被引量、引用量、作者等方面的信息,并能够以可视化图形的方式呈献给用户,用户根据分析的结果,能够快速知晓该领域开山之作是哪篇,哪篇文献是综述,哪篇文献在近期很热门等各种有用信息。
HistCite下载
正如前文所说,官方版本的HistCite由于bug多,已经无法满足需要了,因此这里不使用该版本,而是介绍网友开发的定制版。网友Tsing开发了HistCite Pro版本,这里将下载链接提供给大家(或者猫Q学术派公众号后台回复“HistCite”)。注意,目前HistCite只有Windows版本,不支持macOS系统。
HistCite Pro下载链接:
下载完成后,打开HistCite Pro 2.0文件夹,目录如下。
readme文件介绍了该软件的使用方法,下一章节我也会告诉大家如何操作。
HistCite使用教程
从Web of Science导出数据文件
前面提到HistCite是基于WOS数据库的,因此我们需要到WOS网站检索需要的文献。点击链接http://apps.webofknowledge.com访问WOS官网。如下图所示,在选择数据库项,一定要选择Web of Science核心合集,否则HistCite无法识别。
接下来,搜索自己感兴趣的文献,这里以surface acoustic wave
为例进行检索,如下。
将检索结果按照被引频次降序排列,如下图所示。可见检索到的文献数量高达23959,导出前2000篇文献进行分析就足够了。
接着就开始操作如何导出前2000篇文献。点击下图的导出,并选择其他文件格式。
来到下图界面。由于WOS单次只能导出500条文献,因此在记录来源中填写1-500。2000篇文献需要分4次导出,接着继续填写501-1000,1001-1500,1501-2000,再分别导出即可。记录内容一定要选择“全纪录与引用的参考文献”,文件格式选择“纯文本”。分4次导出后,会产生4个文件。
打开前面下载的HistCite Pro 2.0文件夹,进入TXT目录,将上一步从WOS导出的4个文件复制到该目录,如下图所示。
看出来了吗?只需要将检索的文献放入TXT目录即可,不过在下一次重新分析时记得将TXT文件夹清空,然后将新的文献复制到TXT目录。
接着运行主目录下的main.exe程序,弹出以下命令窗口,输入“YES”
接着,该程序会自动分析上一步导入到TXT文件夹中的文献,并在系统默认浏览器(此处是Chrome)中打开以下窗口。为了确认是否全部文献导入成功,可以从下图看到导入的文献数量为2000条,和前面一致。
上图的右侧我标出了LCS、GCS、LCR、CR,这几个概念非常重要,这里介绍下(引用自Tsing)。
GCS(global citation score), 某一文献在WOS数据库中的总被引用次数。有些引用这篇参考文献的文章可能和你的研究方向毫无关系,但GCS还是会把这个引用数据记录下来。
LCS(local citation score),某一文献在本地数据集中的被引用次数。因为你导入Histcite的文章都是和你检索词有关系的,可以认为这些文章是你的研究同行,因此如果某一篇文献的LCS值很高,就意味着它是你研究领域内的重要文献,很有可能是你领域内的开创性文章,注意LCS高的文献和GCS高的文献不一定是同一篇!
LCR(local cited references), 某一文献引用本地数据集中参考文献的数目。根据LCR值的排序,可以快速定位近期关注该领域的重要文献,因为某一篇文献引用当前数据集中的文献数越多,说明它非常关注你检索的这个研究方向的文献,和你的研究肯定有相似或者可参考之处,可以从该文章中发现新动向。
CR(cited references), 某一文献引用WOS数据库中参考文献的数目。这个值越高,说明这篇文献很可能是综述性文献,可根据该值的排序,也可快速定位综述文献。
这里我一般以LCS对导入的所有文献进行降序排列,以观察哪些文献在本领域具有重要的影响力。以下图为例,按照LCS降序排列后,本领域最具影响力的5篇文献如下。从文献条目的左侧蓝色数字可以看出,这5篇文献的编号分别为52、1392、1498、73、535。
接着,我们以数据可视化方式来展现HistCite的分析结果。点击菜单栏“Tools”,选择“Graph Maker”,如下图所示。
自动弹出下图窗口,并点击“Make Graph”,即可生成一张引文关系图。
上面的引文关系图包含了本领域最具价值的30篇文献之间的引文关系,当然数量30是可以在左侧设置面板进行修改的。为了让引文关系图更加清晰,这里建议将左侧Size设置成full,并再次点击Make Graph,获得下图。
下面重点说下如何读懂引文关系图。
可以看出,图中共有30个圆圈,每个圆圈中间都有一个数字标号,这个数字标号即对应了文献的标号。不同圈的大小可能不同,圈越大,代表该文献的本地被引次数越多。不同圈之间有箭头连接,箭头代表着文献之间的引用关系,越大的圈,会有更多的箭头指向它。多数情况下,最上面的那个圈最大,对应了左侧时间轴的最早时间,也就是说这篇文献很可能是本领域的开山之作。
试着找出圈最大的5篇文献,可以发现这5片文献的编号正好是52、1392、1498、73、535,这和前面按照LCR降序排列得到的结果是一样的。
如果将引文分析图和左侧的时间轴结合起来看,可以观察本领域研究的发展历程,以及近几年研究热度如何。
如果想要保存引文分析图,可以右击引文分析图,选择“复制图片”,或者点击左上角的“Print graph”打印引文分析图,如下所示。
到这里,HistCite主要功能就介绍完了,更多的用法可阅读下面的参考资料。
本文由博客一文多发平台 OpenWrite 发布!
这是尾巴
读过本文,如果觉得有收获,欢迎点赞转发。
想阅读更多内容,可以到我的公众号:青柠学术逛一逛,优质的科研技巧、效率工具等着你。
博主:浙江大学电子工程博士生,剑桥大学交流生,国家奖学金获得者。