登录注册写文章

python简单实战项目：《冰与火之歌1-5》角色关系图谱构建——人物关系可视化

python简单实战项目：《冰与火之歌1-5》角色关系图谱构建——人物关系可视化

先来张Gephi绘制酷炫的任务关系图

这里写图片描述

图中每个节点代表一个角色，节点与节点之间的连线代表共现，而连线的粗细表示共现的频次多少。节点的大小以及颜色深浅表示度的大小，即一个角色参与共现的总频次。

现在说说这张图的实现步骤：
1.对挖掘获取的语料进行角色抽取
2.对出现同一章节的角色进行合并
3.使用步骤2中的数据进行共现矩阵计算
4.利用UCINET、NETDRAW、Gephi对共现矩阵实现可视化。

1.对挖掘获取的语料进行角色抽取

先前原本使用的是jieba和nlpir两种自然语言处理包进行角色抽取的，但是后面发现效果特别差，所有后面则从百度百科上档了一批角色列表下来，那这个与原文本进行比对，实现角色的抽取。

这里写图片描述

2.对出现同一章节的角色进行合并

写爬虫的时候就实现一边爬一边对角色进行抽取。

这里写图片描述

3.使用步骤2中的数据进行共现矩阵计算

读取数据库，使用关键词共现矩阵算法构建矩阵。
算法请参考python构建关键词共现矩阵
共现矩阵

计算结果

4.利用UCINET、NETDRAW、Gephi对共现矩阵实现可视化

本博客的重点在这里~
点击打开UCINET，

点击file→Open→选择csv格式的共现矩阵数据

成功导入数据后，然后点击file→Save as，将数据保存为.##h后缀格式文件。

打开netdraw，依次如下图点击，打开刚刚保存的.##h文件

这里写图片描述

这个时候其实已经可以发现，netdraw已经把共现网络绘制出来了，但是效果太low了，所以这里使用gephi绘制更好的效果。
使用gephi之前，需要将netdraw打开的文件另存为.net文件。

打开运行gephi，使用gephi直接打开刚刚保存的.net后缀文件。

由于是对角色进行简单抽取，角色和角色之间不存在方向传递的性质，因此这里选择无向的。

13.png

14.png

如果是中文文本的话，下方的字体也需要改成中文的字体。比如黑体、宋体等。

15.png

16.png

17.png

18.png

19.png

20.png

滤波的作用是对结果进行筛选，这里设置度来作为筛选条件。

21.png

22.png

23.png

最后编辑于：2017.12.07 06:18:46

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

[3/4]我所经历的大数据平台发展史（三）：互联网时代 • 上篇
//我所经历的大数据平台发展史（三）：互联网时代 • 上篇http://www.infoq.com/cn/arti...
葡萄喃喃呓语阅读 51,729评论 10赞 199
Android - 收藏集
Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
passiontim阅读 179,466评论 25赞 708

Spring Cloud
Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具（例如配置管理，服务发现，断路器，智...
卡卡罗2017阅读 136,743评论 19赞 139
如何学好项目管理PMP(考点总结)
PMP第五版考点汇总冲刺版第一章引论 P2：《PMI道德与专业行为规范》详细描述从业者在责任、尊重、公正、诚实方...
文小梦阅读 23,743评论 5赞 102
龙勃罗梭的犯罪预防思想
一理论构成（1）19世纪的欧洲，当时的科学技术已经有了很大的发展与进步，很多科学文明的思想不断涌出，其中我们所...
李赫先生的昵称阅读 3,377评论 4赞 2

友情链接更多精彩内容

14赞15赞

赞赏

手机看全文