zeppelin 是一款开源的可视化工具,可以对接多种数据文件系统和不同格式的数据文件,支持多种语言的开发,换句话说就是可以通过在线编程的方法处理底层文件系统上的数据。将得到的处理结果给予报表展示。
------写在前面
zeppelin的安装配置
下载zeppelin。
wget http://mirrors.tuna.tsinghua.edu.cn/apache/zeppelin/zeppelin-0.7.3/zeppelin-0.7.3-bin-all.tgz
解压之后,目录结构如图所示
进入conf目录
解压后,进入解压缩目录A(tar -xzvf .tgz)
进入conf目录,将两个文件后缀的temple去掉(mv x.xml.temple x.xml)
回到A目录,启动zeppelin( bin/zeppelin-daemon.sh start )
打开浏览器看效果(浏览器的地址栏输入 localhost:8080)
zeppelin的编程
zeppelin 默认是支持scala 编程的工具,当然还支持sql,python,R等
建立notebook,notebook可以看作一个project。
在线编程处理数据
更具上面的提示,选择不同的计算引擎,需要开始的时候加上前缀。然后在线编程
说明,图像可以更具框选的类型展示,需要做到维度和指标的确立。、重点是编程,SQL编程,python...scala等