登录注册写文章

Datawhale 学术前沿趋势分析 Tesk1 论文数据统计

Datawhale 学术前沿趋势分析 Tesk1 论文数据统计

首先导入需要的包。

接下来读入100行数据，查看数据大致情况。

从图中可以看出，每行数据均有14个字段。
我们读入数据的id,分类和上传时间字段。大致统计一下数据。

我们统计一下，在本数据集中共出现了多少种独立的数据集。

从结果可以看出，共176个子集。
接下来我们提取出19年以后的论文。

在得到了2019年以后的所有论文以后，我们挑选出计算机领域内的所有文章。这里需要使用爬虫。

我们将2个表格合并后，可以用饼图看下每一个大类的文章占比情况。

最后计算一下计算机领域2019年和2020年各小类论文的分布情况。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

数据统计分析部分报告
为保证论文报告，图片部分和相关结论暂时不写出来。 2.2对应分析对应分析的基本思想是将一个联列表的行和列中各元素...
周赫威阅读 974评论 0赞 0
实力验证功不唐捐——刚学了数据透视，就能帮朋友搞定论文数据统计分析
前段时间在网易云课堂上扒拉了几位老师的Excel数据透视功能的课程，每天下班到家后，虽然已经十点，但仍然一天一课，...
我是银璃阅读 199评论 0赞 0

关于Mongodb的全面总结
关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
中v中阅读 32,355评论 2赞 89
家长会谈合作
久违的晴天，家长会。家长大会开好到教室时，离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。放学铃声...
飘雪儿5阅读 7,937评论 16赞 22
2019－11－28 周四阴
今天感恩节哎，感谢一直在我身边的亲朋好友。感恩相遇！感恩不离不弃。中午开了第一次的党会，身份的转变要...
余生动听阅读 10,978评论 0赞 11

友情链接更多精彩内容

赞1赞

赞赏

手机看全文