以前写过一篇《用Tableau画和弦图》,介绍了Noah Salvaterra大神的和弦图制作方法,完全只是模仿,看不懂思路。
网上也看到有另一种和弦图,只是点之间用连线表示关系,这种看起来就简单多了,我研究了一段时间,但是总是有一些小问题得不到解决,就一直没有分享。前些天,有人问起制作方法,既然答应了要写一篇,所以就分享一下心得。严格意义上这不是一个完美的制作方法。
创建数据集
数据集来自混子哥的公众号——着迷小课里的《唐朝诗人朋友圈》,我自己整理了一下数据
链接: https://pan.baidu.com/s/1GV1D14DZ3zRwUO3zCM0CNA 提取码: z4fb
这里要说一下,一共29个诗人,每个诗人都有一个顺序编号(1-29),姓名1顺序和姓名2顺序,就是取的这个顺序编号,这两个字段决定了,每个诗人在圆环中的位置。
姓名1位置和姓名2位置是辅助列,辅助计算后面的4个字段,数据集的excel表里有公式,大家可以自己研究一下,很简单。
另一张表是link表,用来增加数据密度。
导入数据data表和link表,做表连接,这样每行数据就变成了102行。
创建计算字段
SEPT1
- 创建参数max sort
这个字段决定了要显示多少个点,目前是29个诗人,所以选择29,多了圆环会有缺口,少了会只显示一部分
name1.x=COS([姓名1顺序]/[max sort] * PI() * 2)
name1.y=SIN([姓名1顺序]/[max sort] * PI() * 2)
name2.x=COS([姓名2顺序]/[max sort] * PI() * 2)
name2.y=SIN([姓名2顺序]/[max sort] * PI() * 2)
SEPT1的4个计算字段,确定了每个点在圆环上的X、Y值,如果姓名1和姓名2都出现的,那么这个点就会有重复值,也就是后面问题的根源。
SEPT2
angle.x=COS((ACOS([name1.x])+ACOS([name2.x]))/2)
angle.y=SIN((ASIN([name1.y])+ASIN([name2.y]))/2)
segment length=SQRT(([name2.x] - [name1.x])^2 + ([name2.y] - [name1.y])^2)
SEPT2共3个计算字段,segment length就是有关系的两个姓名之间的直线距离,用的是勾股定理。
SEPT3
- separator=
IF [T] <=1
THEN "chord"
ELSEIF [T] = 2
THEN "start point"
ELSEIF [T] = 3
THEN "end point"
END
这样区分了数据点的类型,0.01-1这100行用来画弦,也就是中间的连线,2和3两行用来画点,也就是姓名1和姓名2。
SEPT4
- 创建distance参数
用来调节弦和点之间的距离
x=
IF [T] >= 0 AND [T] <= 1
THEN
(( (1 - [T])^2 ) * [name1.x]) +
(2 * (1 - [T]) * [T] *
(
((2 - [segment length])/ 2) *
[angle.x]
)
) +
([T]^2 * [name2.x])
ELSEIF [T] = 2
THEN [distance] * [name1.x]
ELSEIF [T] = 3
THEN [distance] * [name2.x]
END
y=
IF [T] >= 0 AND [T] <= 1
THEN
(( (1 - [T])^2 ) * [name1.y]) +
(2 * (1 - [T]) * [T] *
(
((2 - [segment length])/ 2) *
[angle.y]
)
) +
([T]^2 * [name2.y])
ELSEIF [T] = 2
THEN [distance] * [name1.y]
ELSEIF [T] = 3
THEN [distance] * [name2.y]
END
这计算字段利用的是二阶贝塞尔曲线公式,大家可以自行百度,如果希望自己控制弦的弧度,可以把(2 - [segment length])/ 2)设置成一个参数,大致在-1到1之间,1的时候基本上是直线。
制作图表
将[x]拖到列功能区,[y]拖到行功能区,取消聚合
标记类型选择“线”,将[T],拖到“路径”
拖动[separator]、[姓名1]、[姓名2]到“详细信息”
这样和弦图的样子基本上就有了。
现在我们可以再创建两个计算字段
SEPT5
- size=
IF [T] = 2 then [姓名1总次数]
ELSEIF [T] = 3 then [姓名2总次数]
ELSE 0.1
END
- lable=
IF [姓名1第一次出现]= 1 and [T] = 2 then [姓名1]
ELSEIF [姓名2第一次出现] = 1 and [T] = 3 then [姓名2]
ELSE NULL
END
- 把[size]拖到“大小”,[lable]拖到“标签”,看着就有点意思了
但是如果直接把[关系]拖到“颜色”里,圆点上的颜色就会有问题
那么我们新建一个字段,只显示圆点
- x.shape=
IF [T] = 2 and [姓名1第一次出现]=1
THEN [distance] * [name1.x]
ELSEIF [T] = 3 and [姓名2第一次出现]=1
THEN [distance] * [name2.x]
END
- 把[x.shape]字段拖到列功能区,双轴并同步轴
大致效果如下,这样就可以区分开弦和点,可以根据需要,分别调整点和线上的颜色,大小,标签等。
大家可以到我的public上下载我做完的文件。
public地址:https://public.tableau.com/profile/jiangbin#!/vizhome/TangDynastypoetrelationship/1_1
目前这种方法只适用于点和线比较少的情况,一般来说数据量大了以后,需要通过集动作高亮显示,这里我参考过一些public上的viz作品,但是实验下来总会有些小bug。原因是姓名1和姓名2中都有的人,导致这个点上 "start point"和"end point"都会有值,而我只想取 "start point",取值的时候就会有偏差。
这里就不介绍了,等研究透彻了再说吧。
此篇文章已发布到我的公众号:saodisir,有兴趣也可关注一下