论文题目
网络舆情场内信息受众观点的“三体”可视化框架构建
论文完成的工作
提出了一套检测和分析网络场内舆情的方法。
采用的图
纯解决理论,无实际图样或可视化作品
方法
首先就网络舆情场内特征,做了一定的分析,并解析成了一个“三体”模型,即:受众、情感立场、应事实体。模型大致如下:
还采用了矩阵来描述多值形式背景:阵的行列分别对应在概念体系中出现的对象与属性, 行列交叉处是某对象a (audience) 在某属性e (entity) 上的取的值, 即e (a) , 如果对象和属性之间并无隶属关系, 那么该对象属性的行列交叉处为空。
如图所示:
好处:
可以反应对一个事物的多种立场态度以及其转化状况。
然后要做分析的话还是要进行单值化转化。而转化的结果就是将每个属性的取值确定为“肯定”、“中立”或“否定”。
而为了得出观点的激进性,又对副词进行分析,并且进行了分档。公式如下:
这样,将可以得到各个受众对于各件事的看法,可以通过网格的形式来对此加以描述:
可以借鉴的地方
主要是他的这种思维方式吧,首先目的是了解网络舆情,于是把相关元素抽象成了三类:受众,情感立场,应事实体。这样,复杂的问题就转变成了这三者之间的关系。在做一些可视化工作的时候,也可以用这样的思考方式。
不再是:拥有什么数据--去思考可以呈现和展示一些什么
而是:根据大致的方向,考虑一下自己想要探究的问题--再去根据问题,抽象一下相关的实体--根据我们的已有数据尝试去描述这些实体,看能否得到想要的东西。
论文题目
基于Python的可视化工具研究与应用
论文完成的工作
介绍了一些python的可视化库,他们分别是
- matplotlib :他是第一个Python的可视化库,但是这个工具比较的老,使用方法比较复杂。
- seaborn :这是基于matplotlib开发的,用它制作图表可以让代码变得相对简洁,绘图风格和色彩搭配也比较好。不过因为它是matplotlib的,所以如果想要修改默认参数,还是得了解matplotlib,那么就又回到了上面的问题。
- bokeh :它完全基于Python,特点:可以制作可交互图表,允许输出JSON,HTML等网络样式,也支持数据流和实时数据,样图如下:
- plotly :和bokeh一样可以制作可交互图表,可以通过Python notebook使用。可以提供直线图,树状图和三维图表。
- gleam :Gleam 借用了R中 Shiny 的灵感。 它允许你只利用 Python 程序将你的分析变成可交互的网络应用,你不需要会用HTML CSS 或者 JaveScript。Gleam 可以使用任何一种 Python 的可视化库
提出了一个可视化解决方案:基于B/S架构,使用Django框架,加上mongoDB数据库,用canvas作为前端绘制的可视化画布,以bokeh做绘图工具。
引起的思考和可以考虑的借鉴
目前我们在做可视化的作品时,往往就是以js,css,html这样的纯前端方法,在辅以一些js的绘图库,和一些js的框架来实现的。我们展示的数据往往是写代码预先处理好的,其实就相当于说,整个作品相当于是没有后台的。但是可能有时候的场景会是,我们需要展示的数据都在数据库里,如果我们以取出数据并处理数据后,用json或csv的格式传给前端的方式来展示的话,那么一旦数据库里的数据有所变化,那么我们就需要重新完成"取出数据和处理数据"的过程。
但如果按照这个文章所介绍的方式制作可视化作品,那么就可以做到,只要数据库里的数据类型不变,即便是数据的内容有所变化,也可以不用重写代码,数据库里数据的增删改都是可以实时的映射到我们的图表里的。
缺点:该文章只是给出了一条思路,并没有什么demo来证实其可行性,而且也没有相应的效果图来让人取舍。
论文题目
大数据可视化工具比较及应用
文章编号:1672-5913(2018)06-0097-06
论文完成的工作
介绍了当前的大数据背景,并说明了大数据时代,可视化的意义。
然后就开始介绍各出名的可视化研究单位,以及他们的各种成果还有一些知名的可视化大会。
eg: 我们经常接触到的D3.js和tableau就是来自斯坦福大学可视化组。
主要的可视化学术会议:IEEE VIS 2018、IEEE PacificVis 2018、BioVis 2018、ChinaVis 2018.
然后对于tableau,power BI,D3.js做了典型的分析。
tableau主要的好处就是可以不写代码。
power BI则是可以连接许多来自不同源的数据
d3.js。。。
采用的图
这是一个用d3.js绘制的图,并不复杂,只是作为一个demo来介绍d3用的。
可以借鉴的地方
我感觉这篇文有种虎头蛇尾的感觉,当作错误示范比较好。但是在开头的地方写大数据时代背景写的还是挺好的。
如下:
大数据是一个宽泛的新概念,一般是指通过
快速获取、处理、分析以从中提取价值的海量、
多样化的交易数据、交互数据与传感数据,其最
终目标就是从复杂的数据集中发现新的模式与
知识,挖掘得到有价值的新信息。大数据具有体
量巨大(volume)、类型繁多(variety)、时效性
高(velocity)以及价值密度低(value)的特征 [3]
,
这给大数据分析带来极大的挑战。随着各行业和
部门产生的数据量急剧增长,工业界和学术界共
同努力,提出了各种数据分析方法,如数据挖
掘、机器学习、智能算法、统计分析等,但这些
方法对专业知识要求较高,普通用户难以利用并
从中挖掘数据信息。
论文题目
动态交互式可视化应用研究
文章结构
首先简述了当前时代可视化的需求,
然后对比了静态可视化技术与动态交互可视化技术的区别
最后列举了一些当前的常用动态可视化应用与技术
具体应用分类
数据和视图规范
- 过滤:数据值的过滤是动态交互可视化当中必不可少的一部分。用户能
够基于他们的兴趣或想要的数据信息来过滤数据,进而缩小数据探索范围,减少数据的复杂
性。- 排序:排序可视化可以有效的显示信息的发展趋势和价值簇
- 派生:派生是指用户在进行迭代循环分析时,一些变量可能需要进行转换或者从现
有的数值中衍生出新的属性。
视图操作
- 选择:选择。用户可以通过一些有限的操作来选择他们所感兴趣的项目,表明了他们的意图,并最终决定可视化分析工具展现出用户所需的数据信息
- 导航:一个常见的导航模式广泛引用视觉信息,追求概述第一,通过缩放、过滤等,按需查找细节
- 协调:用户在分析问题时通常会需要协调多个视图,从而使用户能够从不同角度来分析他们的数据,同时方便多个视图间的比较
- 组织:当用户使用多个视图时,他们会面临怎样合理组织多个不同的可视化视图来实现数据信息的布局和显示,良好的组织能够简化可视化视图,图例和交互式控件
分析的过程和来源
- 记录:用户在进行交互式探索过程中遇到需要马上进行重新分析或者随后重新访问的问题时,需要对先前分析的内容进行记录。为了支持迭代分析,可视化分析工具应记录与用户进行交互的历史
- 注释:注释操作可以帮助用户更好的突出和理解所要表达的数据信息。一种有效的方式是允许在视觉历史中对状态进行文本注释
- 共享:可视化分析工具应该支持社交互动,通过社交互动的建立,用户可以与其他的分析人员进行讨论并将其结果进行共享,从而获得多方位的数据信息
- 指导:随着数据类型的不断增加,一些非专业人士在操作可视化工具时会遇到各种问题,这时需要可视化工具能够指导用户如何进行操作以达成自己的意图