data analysis task3:code statistics

任务主题:论文代码统计,统计所有论文出现代码的相关统计;
任务内容:使用正则表达式统计代码连接、页数和图表数据;
任务成果:学习正则表达式统计;

数据处理步骤

在原始arxiv数据集中作者经常会在论文的comments或abstract字段中给出具体的代码链接,所以我们需要从这些字段里面找出代码的链接。

确定数据出现的位置;
使用正则表达式完成匹配;
完成相关的统计;

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容