几天前偶然发现Adam E McCann大神的tableau public上有一个作品居然用tableau画出了梵高的《星夜》,颇为震惊,没想到还有这种操作,所以就暗下决心去研究一下,经过几天的研究,终于自己也尝试成功了,并进行了一些简化。
Tableau public地址:https://public.tableau.com/profile/adam.e.mccann#!/vizhome/Data17JediChartsPresentationPart1/ArtFinal
首先这个作品原理很简单,就是获取了每个像素点的坐标和颜色,然后填充上,但是困难的并不是技术,而是下面两点:
- 如何获取每个像素的颜色值
- 如何自动填充颜色
下面就进入分享阶段,我这次试图用tableau画下面这幅彩铅画。
获取数据
获取数据还是使用python,这次用到的是PIL库
from PIL import Image
#RGB转Hex函数
def RGB_to_Hex(rgb):
strs = '#'
for i in rgb:
num = int(i)
strs += str(hex(num))[-2:].replace('x','0').upper()
return strs
im = Image.open('d:\\彩铅.jpg')
width = im.size[0]
height = im.size[1]
RGB=[]
#获取每个像素的RGB值和hex值
for x in range(width):
for y in range(height):
r, g, b = im.getpixel((x,y))
rgb = im.getpixel((x,y))
_hex=RGB_to_Hex(rgb)
getpixel=[x,y,r,g,b,_hex]
RGB.append(getpixel)
这样我们就获得了,所有像素的坐标和颜色,下面导出数据
import pandas as pd
df=pd.DataFrame(RGB,columns=['X','Y','R','G','B','hex'])
df.to_excel('d:\\rgb.xlsx')
这样我们就得到了最基本的数据,因为图片像素是422*437像素,所以一共是184414行数据。
下面就要进行整理,其实R、G、B三个字段没有什么意义,最重要的就是hex字段,因为要根据hex字段的值来自定义调色板。
下面就要新建一个表,复制出hex字段,去除重复值,并给每个hex值一个唯一编号。整理完后一共是51728个颜色值。
这个唯一编号与后面要自定义的调色板是一一对应的
然后把两张表合并成一张表(vlookup即可),rgbcolor就是上面的唯一编号
自此基本数据就整理完毕了。
自定义调色板
官网教程:https://onlinehelp.tableau.com/current/pro/desktop/zh-cn/formatting_create_custom_colors.htm
三种自定义调色板,大家自己研究,我们这次要用的是“创建自定义连续调色板”。
把刚才的51728个颜色值整理成,官方要求的格式,用<color>和</color>包裹起来,顺序一定不要乱,保持原来的顺序。
然后用记事本打开Preferences.tps文件,在<workbook>和</workbook>之间插入整理好的颜色值,并保存。
<preferences>
<color-palette name="My Sequential Palette" type="ordered-sequential" >
<color>#00030E</color>
<color>#000511</color>
<color>#000710</color>
<color>#000813</color>
……此处省略几万行
<color>#FFE7E6</color>
<color>#FFE7E8</color>
<color>#FFEAE5</color>
<color>#FFEDE9</color>
</color-palette>
</preferences>
这样按顺序整理后,第一值#00030E就对应调色板的0值,以此类推。
开始作画
-
用tableau引入数据
- 把[X]拖到列功能区,[Y]拖到行功能区,在分析中取消“聚合度量”
- 编辑[Y]轴,选择“倒序”
-
把[rgbcolor]拖到颜色标签,这时候你可能会看到如下的图,这说明曙光就在眼前。
因为系统默认了用蓝色发散的颜色,所以每个点的颜色也就自动匹配到了不同的蓝色,但是也能看到轮廓了。
-
编辑颜色,选择刚才创建的My Sequential Palette,点击确定。
注意这里0-51727(51728个颜色值),每个值都与刚才建立的自定义调色板上的顺序一一对应。这就是自动匹配颜色的奥秘所在。
- 大功告成
在这个作品的研究中,自己收获颇多,以前知识的盲区,也顺便补足了,这就是学习的魅力所在。其实,对于tableau每个知识点的研究,只有不断的挑战极限,才能真正研究的透彻。要不畏困难,坚信自己。
成品的Tableau public地址:https://public.tableau.com/profile/jiangbin#!/vizhome/Drawingwatercolor/1_1
补充:
鉴于数据量比较大,excel运行缓慢,晚上又整理了一下代码,自动生成所需要的数据,然后只需复制颜色值表格里的preferences字段到Preferences.tps文件即可,省去了自己整理数据的麻烦。
from PIL import Image
import pandas as pd
import numpy as np
#RGB转Hex函数
def RGB_to_Hex(rgb):
strs = '#'
for i in rgb:
num = int(i)#将str转int
#将R、G、B分别转化为16进制拼接转换并大写
strs += str(hex(num))[-2:].replace('x','0').upper()
return strs
im = Image.open('d:\\彩铅.jpg')
width = im.size[0]
height = im.size[1]
print(width,height)
#获取每个像素的RGB值和hex值
RGB=[]
for x in range(width):
for y in range(height):
r, g, b = im.getpixel((x,y))
rgb = im.getpixel((x,y))
_hex=RGB_to_Hex(rgb)
getpixel=[x,y,r,g,b,_hex]
RGB.append(getpixel)
#利用pandas整理数据表
df=pd.DataFrame(RGB,columns=['X','Y','R','G','B','hex'])
#新建、编辑颜色值表
df2=pd.DataFrame(df['hex'].drop_duplicates(),columns=['hex'])#去掉重复值
df2.sort_values(by=['hex'],inplace=True)#排序
df2['hex_index']= np.arange(0,df2.shape[0],1)#用等差数列标记颜色唯一值
#输出坐标系表
pd.merge(df,df2).to_csv('d:\\坐标系.csv')
#preferences文件格式转换
df2['preferences']=df2['hex'].map(lambda x:'<color>'+str(x)+'</color>')
#输出颜色值表
df2.to_csv('d:\\颜色值.csv')
此篇文章已发布到我的公众号:saodisir,有兴趣也可关注一下