AMiner标注工具输入数据格式

AMiner标注工具输入数据格式

case_name

string类型,需要标注的作者名字。

pub_list

list类型,里面每个元素是一个pub对象,需要有以下属性:(要求都是英文)

  • id:string类型,kexie.aminer.cn数据库中的paper的id
  • affiliation:string类型(case_name对应作者的机构信息)
  • title:string类型,论文标题
  • venue: string类型,发表期刊名称
  • year: int类型,发表年份
  • authors: list类型,每个元素都是作者名的string,注意不要包括case_name对应的作者名

confirmed_person_list

list类型,里面每个元素都是一个跟case_name相关的作者对象,对象拥有以下属性:

  • id: string类型,kexie.aminer.cn数据库中的作者的id
  • name: string类型,作者名字
  • org: string类型,作者机构
  • tags: list类型,里面每个元素都是string类型,作者研究领域的关键词

confirmed_pub_id_list

dict类型,里面每个元素的key对应confirmed_person_list里面一个学者的id。

value是一个list,list里面每个元素是这个学者档案下论文的id。

ambiguous_pub_id_list

list类型,里面每个元素都是一个未分配论文的id

注意

ambiguous_pub_id_list和所有学者的论文list的并集应该是pub_list中所有的论文

ambiguous_pub_id_list和所有学者的论文list不应该存在任何的交集!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,554评论 0 13
  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 4,537评论 0 5
  • # 一度蜜v3.0协议 --- # 交互协议 [TOC] ## 协议说明 ### 请求参数 下表列出了v3.0版协...
    c5e350bc5b40阅读 683评论 0 0
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 6,759评论 0 17
  • Lua 5.1 参考手册 by Roberto Ierusalimschy, Luiz Henrique de F...
    苏黎九歌阅读 14,026评论 0 38