spagobi
SpagoBI是一个商业智能平台,为商业智能项目提供了一个完整开源的解决方案。它涵盖了一个BI系统所有方面的功能包括:数据挖掘、查询、分析、报告、Dashboard仪表板。
优点:开源
缺点:
源码:https://github.com/SpagoBILabs
参考资料:https://www.oschina.net/p/spagobi
https://baike.baidu.com/item/SpagoBI/20132386?fr=aladdin
http://www.cnblogs.com/mybi/p/5120265.html
https://www.evget.com/article/2014/5/21/21029.html
pentaho
Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案,侧重于大 中型企业应用。它允许商业分析人员或开发人员创建报表,仪表盘,分析模型,商业规则和BI流程。
优点:开源,易于将报表发布到服务器。新颖的服务器用户界面、易于安装和规范的说明文档。提供了多个第三方插件,还有许多Pentaho社区工具可以使用,大多数工具既与社区版兼容,又与企业版兼容。值得一提的一个工具是CTools,这是一系列组件和工具,作为Pentaho的附件而使用。Ctools拥有诸多特性,比如图形生成器、仪表板编辑器、数据访问定制以及Pentaho开发框架。不过总的来说,Pentaho安装、配置和运行起来很容易。说明文档很完备,服务器和报表设计器对于新手和专家来说同样界面直观。可以轻松、可靠地发布报表是一大优点。
缺点:报表设计器和服务器方面性能有点慢。即便在配备四核处理器、内存充足、使用千兆以太网的服务器级机器上也是如此。在典型台式机上运行的报表设计器也是同样一种情况。
社区:http://www.pentahochina.com/portal.php
参考资料:https://baike.baidu.com/item/Pentaho/3674418?fr=aladdin
https://www.oschina.net/p/pentaho
http://os.51cto.com/art/201508/489167_all.htm(评测)
birt
BIRT是一个Eclipse-based开放源代码报表系统。它主要是用在基于Java与J2EE的Web应用程序上。BIRT主要由两部分组成:一个是基于Eclipse的报表设计和一个可以加到你应用服务的运行期组件。BIRT同时也提供一个图形报表制作引擎。
缺点:在学习资源、学习途径和技术交流平台上的表现差强人意,数据源支持度不够,报表操作复杂不友好。未开发出移动端平台,只提供间接的pdf方式打印。报表表达式编辑器对中文的支持却有些问题。没有权限方面的辅助功能
优点:开源,操作界面清晰直观,布局比较科学,图表还是比较漂亮的,而且本地化做的还好,安装之后操作界面是中文的
官网:http://www.eclipse.org/birt/
源码:https://github.com/eclipse/birt
社区:http://birthome.com/forum.php
http://www.eclipse.org/birt/community/
参考资料:https://baike.baidu.com/item/BIRT/7747222?fr=aladdin
https://www.oschina.net/p/birt
http://www.finereport.com/knowledge/acquire/birt.html
https://zhidao.baidu.com/question/617475282444050652.html
http://highforest.blog.51cto.com/125539/42134/
ssrs
SQL
Server Reporting Services(SSRS),微软企业级报表平台,和SQL Server Integration Service以及SQL Server Analysis Services一样,都是微软BI套装的一部分。虽然SSRS和其他微软BI产品集成的很好,但SSRS和其他平台的产品集成也很容易。SQL Server的报表功能为你公司提供了创建,分发和管理报表的功能。
使用场景:仪表盘、即时分析、管理
优点:SSRS开发快速,部署及管理相对简单,效果尚可
缺点:在页眉和页脚中绑定字段并不明显,在cross-tabulations中不支持expando横向汇总。没有直接支持报表页眉和页脚,交互性极差。感觉技术有点老了。
社区:http://www.csdn.net/tag/SSRS
https://www.hellobi.com/topic/SSRS
http://so.csdn.net/so/search/s.do?p=1&q=ssrs
参考资料:http://www.cnblogs.com/CareySon/archive/2012/02/27/2369511.html
http://bbs.csdn.net/topics/390366876
https://gxnotes.com/article/38272.html
https://ask.hellobi.com/question/12608
https://ask.hellobi.com/question/490
powerbi
Power BI是一套商业分析工具,用于在组织中提供见解。可连接数百个数据源、简化数据准备并提供即席分析。生成美观的报表并进行发布,供组织在Web和移动设备上使用。每个人都可创建个性化仪表板,获取针对其业务的全方位独特见解。在企业内实现扩展,内置管理和安全性。
优点:跨终端
缺点:收费
官网:https://powerbi.microsoft.com/zh-cn/
参考资料:https://msdn.microsoft.com/en-us/library/dn877544.aspx
https://powerbi.microsoft.com/en-us/blog/intro-pbi-js-api/
http://www.cnblogs.com/asxinyu/p/Power_BI_Introduce.html
http://www.cnblogs.com/asxinyu/
https://powerbi.microsoft.com/zh-cn/power-bi-embedded/
https://powerbi.microsoft.com/zh-cn/documentation/powerbi-service-get-started/
widestage
Lightweight BusinessIntelligence tool for reporting mongodb, postgresql, Mysql, & MS sql data
优点:开源
缺点:国内少见
源码:https://github.com/widestage/widestage(基于nodejs实现)
参考资料:https://www.youtube.com/watch?v=7HB8Ipb1-V8
redash
Redash是一款开源的BI工具,提供了基于web的数据库查询和数据可视化功能
在数据运维人员的日常工作中,常会遇到需要将数据库中的数据查询并展示出来的问题,可能总是需要让前端开发人员来做web页面帮助完成这些需求。redash提供了这么一种简单便捷的方式将这些工作标准化:在web页面上输入sql语句,使用查询返回的结果构造数据可视化图表,用户可以将这些图表结果拖动构造成自己需要的数据面板,在很大程度上可以缓解数据运维人员对前端开发人员的需求。
源码:https://github.com/getredash/redash(基于python)
参考资料:https://www.oschina.net/p/redash
biplatform
敏捷BI分析平台,提供高性能、准实时、可扩展的、一站式的BI建模、分析平台。
缺点:百度出品,可持续性堪忧
源码:https://github.com/baidu/BIPlatform
参考资料:https://my.oschina.net/biplatform/blog?sort=time&temp=1504681846961
openi
OpenI是一个基于网络的商务智能应用程序。是一个彻头彻尾的开发的解决方案,轻松可视化OLAP数据,关系型数据库管理系统,数据挖掘工具和直观的建立和发布交互式的报告,分 析。它用于制作Web OLAP报表,可以部署在任何J2EE服务器中,支持交互式OLAP报表的发布。它能够使用关系型数据源和基于XMLA的数据源。
缺点:感觉技术有点老,好像没人维护了
官网:http://openi.sourceforge.net/index.html
参考资料:https://www.oschina.net/p/openi
superset
Superset其实是一个自助式数据分析工具,它的主要目标是简化我们的数据探索分析操作,它的强大之处在于整个过程一气呵成,几乎不用片刻的等待。Superset通过让用户创建并且分享仪表盘的方式为数据分析人员提供一个快速的数据可视化功能。
在你用这种丰富的数据可视化方案来分析你的数据的同时,Superset还可以兼顾数据格式的拓展性、数据模型的高粒度保证、快速的复杂规则查询、兼容主流鉴权模式(数据库、OpenID、LDAP、OAuth或者基于Flask AppBuilder的REMOTE_USER)
通过一个定义字段、下拉聚合规则的简单的语法层操作就让我们可以将数据源在U上丰富地呈现。Superset还深度整合了Druid以保证我们在操作超大、实时数据的分片和切分都能行云流水。
官网:http://airbnb.io/projects/superset/
源码:https://github.com/apache/incubator-superset
参考资料:
https://segmentfault.com/a/1190000005083953
https://www.2cto.com/kf/201703/616747.html
https://www.youtube.com/watch?v=3Txm_nj_R7M
tableau
Tableau Software致力于帮助人们查看并理解数据。Tableau帮助任何人快速分析、可视化并分享信息。超过42,000家客户通过使用Tableau在办公室或随时随地快速获得结果。数以万计的用户使用Tableau
Public在博客与网站中分享数据。
优点:跨终端
缺点:收费
官网:https://www.tableau.com/zh-cn/products
社区:https://community.tableau.com/welcome
参考资料:https://www.zhihu.com/question/29478254
https://baike.baidu.com/item/tableau/9328520?fr=aladdin
http://shenhaolaoshi.blog.sohu.com/165130852.html
kibana
Kibana是一个开源的分析与可视化平台,设计出来用于和Elasticsearch一起使用的。你可以用kibana搜索、查看、交互存放在Elasticsearch索引里的数据,使用各种不同的图表、表格、地图等kibana能够很轻易地展示高级数据分析与可视化。
优点:开源
缺点:好像依赖于Elasticsearch
官网:https://www.elastic.co/products/kibana
源码:https://github.com/elastic/kibana
社区:https://elasticsearch.cn/explore/category-4
参考资料:http://blog.csdn.net/ming_311/article/details/50619804
关于BI框架给出的建议
目前商业版的BI框架整体完善一些,开源的大部分都是部分功能。如果是自己研发的话,可以基于一些开源的框架。因为完整BI系统比较庞大,为了更好的小步快跑,打造一个敏捷的数据可视化平台,并且省去传统BI的各种逻辑层编辑映射的部分是个不错选择。
超大数据量的情况:
1.收集:flume、databus等
2.缓冲:kafka等消息队列
3.存储:hdfs等
4.计算:mr、spark、sparkstreaming、storm、akka、datasketch等
5.olap:kylin、impala、pinot、druid等
6.数据可视化:spagobi、pentaho、superset、tableau等
通用参考资料:
可视化组件及产品统计:http://www.cnblogs.com/tgzhu/p/6399713.html?utm_source=itdadao&utm_medium=referral