任务主题:论文代码统计,统计所有论文出现代码的相关统计;
任务内容:使用正则表达式统计代码连接、页数和图表数据;
任务成果:学习正则表达式统计;
数据处理步骤
在原始arxiv数据集中作者经常会在论文的comments或abstract字段中给出具体的代码链接,所以我们需要从这些字段里面找出代码的链接。
确定数据出现的位置;
使用正则表达式完成匹配;
完成相关的统计;
任务主题:论文代码统计,统计所有论文出现代码的相关统计;
任务内容:使用正则表达式统计代码连接、页数和图表数据;
任务成果:学习正则表达式统计;
在原始arxiv数据集中作者经常会在论文的comments或abstract字段中给出具体的代码链接,所以我们需要从这些字段里面找出代码的链接。
确定数据出现的位置;
使用正则表达式完成匹配;
完成相关的统计;