AMiner标注工具输入数据格式
case_name
string类型,需要标注的作者名字。
pub_list
list类型,里面每个元素是一个pub对象,需要有以下属性:(要求都是英文)
-
id
:string类型,kexie.aminer.cn数据库中的paper的id -
affiliation
:string类型(case_name对应作者的机构信息) -
title
:string类型,论文标题 -
venue
: string类型,发表期刊名称 -
year
: int类型,发表年份 -
authors
: list类型,每个元素都是作者名的string,注意不要包括case_name对应的作者名
confirmed_person_list
list类型,里面每个元素都是一个跟case_name相关的作者对象,对象拥有以下属性:
-
id
: string类型,kexie.aminer.cn数据库中的作者的id -
name
: string类型,作者名字 -
org
: string类型,作者机构 -
tags
: list类型,里面每个元素都是string类型,作者研究领域的关键词
confirmed_pub_id_list
dict类型,里面每个元素的key对应confirmed_person_list里面一个学者的id。
value是一个list,list里面每个元素是这个学者档案下论文的id。
ambiguous_pub_id_list
list类型,里面每个元素都是一个未分配论文的id
注意
ambiguous_pub_id_list和所有学者的论文list的并集应该是pub_list中所有的论文
ambiguous_pub_id_list和所有学者的论文list不应该存在任何的交集!