一、Rubrik初印象
Rubrik是印度公司?
如果你初次接触这家公司,也以为这是家印度公司,证明你是认真看了看几个创始人的照片的。其实Rubrik是成立于2014年的一家美国公司,总部位于美国加州的帕罗奥托,几个核心创始人来自Nutanix,Exadata和Google,都是业内人士。而投资人中有几个就更有趣了,都是些老江湖,思科前CEO,Symantec的前CEO,还有DataDomain的前CEO,(DataDomain不用多说了吧)和Veritas的创始CEO(Vertitas更不用多说了吧,OG中的OG咯。)这几位作为投资人投资Rubrik无疑会给公司带来很大助力,资金就不用说了,在人才引进、收并购、市场客户拓展方面应该也有不少助力。
Rubrik的自我定位
公司的slogan:“Unlock the Power of Data by
Organizing and Protecting the World's Business Information”。从这句话里面我们至少可以看出两层意思,第一层意思公司目标是“Unlock the power of data”,这是要解决传统灾备数据利用率低的问题。Rubrik的目标就是要将备份数据除了在灾难发生时用于恢复之外,还能更多利用备份数据发挥出数据的价值。第二层意思通过组织和保护商业信息(Organizing and Protecting
the World's Business Information)来实现目标,后半句就是Rubrik对自己现在做的事情的高度总结,Rubrik的主要产品可以概括为一个软件平台,可在跨数据中心和云的安全架构中提供备份、即时恢复、归档、搜索、分析、合规性和副本数据管理等功能,就是通过这些实现“Unlock the power of data”。
Rubrik的市场地位
2014年创立的Rubrik,2017年已经出现在visionaries象限里面了,成立以来进步神速,在2020年,2021年连续2年都已经在《Magic Quadrant for Enterprise Backup and Recovery Software Solutions》魔力象限中的领导者象限了。这个成长的速度是相当不错的,能进入Gartner的厂商至少产品年销售收入方面需要达5千万美刀或者年收入2.5千万美刀但是增长大于20%或者是订阅模式每年的收入2.5千万美刀。除了收入还要在售前支持,交付,渠道建设,对市场客户理解等方面都有要求,对于初创企业要快速到达这些要求还是有些难度的。
Rubrik的融资和并购回顾
看看Rubrik在魔力象限中的走势,在成立短短几年能做到现在这样还是非常不错的,除了团队本身业务底子好而外,Rubrik的快速发展,资本市场也给予了较大的帮助。来看下Rurik的融资和收购历史:
2015年B轮融了4100万美刀,2016年C轮融了6100万美刀,2017年D轮融了1.8亿美刀,估值13亿美刀,2019年E轮融了2.61亿美刀估值33亿美刀,2021年微软投了Rubrik估值大概40个亿美刀,没有透露投资金额,大约是千万级美金。微软投资Rubrik主要是目的是聚焦 Microsoft 365、混合云数据保护和集成云服务,并基于 Microsoft Azure 共同开发和营销零信任数据保护解决方案。几年时间,这个融资能力和节奏妥妥的独角兽。
有了钱,就可以买买买了,Rubrik收购其他公司来快速补足自己产品能力的短板。公开信息可以看到的Rubrik有三起比较典型的收购:
(1)2018年收购了Datos IO,通过收购这家公司获得了NoSql类型数据库和大数据平台的保护能力,现在的Mosaic就是基于收购研发的产品;
(2)2020年收购了Igneous,这是一家专注于NAS数据管理的企业,擅长处理PB级非结构化数据数据。通过收购这家企业,Rubrik提升了海量非结构化数据备份恢复的能力,实现基于快照的永久增量备份恢复,海量文件的索引能力、解决了传统NDMP方式去备份NAS的缺点。
(3)2020年底还收够了Opas AI 。通过收购除了获得产品能力,同时也获得了这些公司的客户。
所以说Rubrik能在成立的短短几年产品发展迅速其背后的资本起到了很大的助推。国内的灾备公司成立10年以上的也有,到现在还没有一家进入这个Gartner B&R魔力象限。
二、Rubrik的主要产品三大件RCDM、Polaris、Mosaic
Rubrik的主要产品组合是Rubrik Cloud Data Management,这是该公司核心平台,Polaris是SaaS的集中管理平台(类似于NBU的OpsCenter)同时扩展了勒索软件防护、数据恢复和数据分类的功能,Mosaic主要用于保护NoSQL类数据库。
第一大件,Rubrik Cloud Data Management(RCDM):作为Rubrik最核心的平台,RCDM由4个核心组件组成:
1.Atlas Cloud-Scale File System:分布式的文件系统,用于存储和管理各版本的备份数据。号称6有大特性:
无单点故障,基于EC的容错性,主要是通过纠删码对数据进行智能编码和分区,在单节点或者2个磁盘异常的情况下仍然能重构原始数据。纠删码在提升了可用容量的同时还保持了高性能。
自学习和自修复(Self-learning and self-healing):在发生故障的时候能自动的调整和重新平衡,以保证系统的弹性。
可线性扩展:支持可无限线性扩展,通过往集群中添加节点实现性能和容量的提升。
Zero-byte clone:支持通过“黄金映像”克隆多份数据(虚拟快照)。可加速测试和开发,也可以用于即时恢复和业务连续性保障。
智能的数据缩减:可智能的进行数据缩减,减少本地或云上的带宽和存储消耗
Flash-optimized:主要是通过个闪存加速和机械盘混合的硬件服务器架构,优化IO吞吐量。这是RCDM的一体机设备硬件平台提供功能的。
这些特性里面,通过公开资料描述来看,看不出有啥特别过人之处,大多友商都有这些特性,主要表达的就是给RCDM的提供了扩展性、高性能、高可靠性,重删功能和虚拟快照功能,虚拟快照就是CDM(Copy Data Management)的核心,通过这个可以实现即时恢复。
2.Callisto:分布式元数据系统:Rubrik 的分布式元数据系统Callisto与 Atlas Cloud-Scale File System 配合,以提供可高速访问的全局索引和目录以进行文件级搜索。它旨在提供无单点故障的持续可用性、线性可扩展性和操作简单性。即便在多个节点故障的情况下,系统仍可以保持对元数据的持续访问搜索。
3.Cerebro:数据管理层,这是RCDM的大脑,用于处理从数据的摄取至数据过期整个全生命周期的数据管理,由Blob引擎(Blob Engine)和一个分布式任务框架构成(Distributed Task Framework)。
Blob引擎:提供核心数据管理服务,包括不变性、数据缩减、保留、复制和归档。Blob Engine采用不可变格式(immutable format )去获取所有数据和应用程序,并加密备份数据以防止勒索软件等破坏。同时,Blob引擎还负责建立索引相关的元数据,如文件名、类型和内容,以构建单个元数据存储库,以便支持跨应用程序、数据中心和云的全局文件级搜索。另外Blob引擎智能地应用全局数据缩减,同时支持快速数据重建,以在数据生命周期的所有阶段最大限度地提高存储效率,最后Blob还负责SLA策略,将过期的快照标记为可安全删除,还可为终端用户提供报告来跟踪合规性。
分布式任务框架(Distributed Task Framework):分布式任务框架在 Rubrik 集群中全局分配和执行任务,自身具有高可靠性. 它应用智能算法进行负载平衡和通过两种方法模型优化资源利用率:任务调度(TaskScheduling)和任务维护(Task Maintenance)。 任务调度确保任务在集群中均匀分布,而任务维护的主要功能是按每天和长期的方式进行SLA策略调度。 一旦设置了 SLA 策略,任务维护就会根据制定的策略来满足既定目标,如数据保留周期、复制和归档。
4.Infinity:该组件主要是对外的接口和实现应用感知。主要就是与外部生态系统进行交互,以便让Rubrik平台感知应用。该层通过 API、连接器和其他协议,以确保 Rubrik 可以发现并有效保护任何受支持的对象。第三方可以通过这类接口来集成Rubrik,比如将Rubrik集成到数据库自身的管理维护界面,方便DBA来维护数据库。
Rubrik产品组合中另外一个重要成员,Polaris,这是一个SaaS的平台,可以将分布在各个环境中的用户数据建立起统一的元数据管理组织框架,实现不同环境数据的统一管理。Rubrik通过这样建立起用户环境数据的统一元数据记录,提供勒索病毒感染文件的恢复,减少敏感数据的暴露风险,关于勒索病毒防护主要是RCDM对于备份数据采用不可变(immutable format)的格式来存储,防止了勒索软件加密覆盖数据,此外结合Polaris Radar来检测元数据是否被匿名访问或者可疑操作来预警。另外还可以通过Polaris对Rubrik分布式环境实现统一管理和云原生环境的保护,比如对MicrosoftOffice 365, OneDrive, IaaS workloads on Microsoft Azure VMs, Google Cloud Platform VMs, Amazon EC2实例, EBS卷, RDS实例的保护。
第三件是Mosaic主要是与RCDM一起实现对NoSQL数据库的保护。通过Mosaic可以对NoSQL实现应用一致性的备份和永久增量的备份,还可以实现比较细粒度的恢复,比如对数据库中某列族,按照某个时间范围进行恢复等特性,支持恢复至异构运行环境。这是前面提到过的,从Datos IO收购整合来的能力。
下表对Rubrik的功能特性做了一个简单总结,要想更进一步了解Rubrik的每种特性或者应用保护的方案介绍可以访问其官方网站www.rubrik.com,每种解决方案Rubrik都提供了介绍。
Rubrik的支持两种订阅模式版本,一种是Rubrik Go,一种是Rubirk Complete Edition,每种又分几种小版本,版本之间就是一些功能授权不同。都是按照三年订阅模式授权。
三、老的江湖,新的大佬
从2017年进入Gartner魔力象限到2021年一年不落,而且连续两年在领导者象限,这个新来的势头很猛,已经成为江湖大佬,甚至敢叫板Gartner了。(2018年Gartner未发B&R魔力象限,这是一个对Gartner来说悲伤的故事,搞B&R的4个分析师被Rubrik挖走,1个被Veeam挖走,直接导致2019年都是新安排分析师来做B&R的报告。据说还有一个分析师求职Rubrik被Rubrik拒绝了,这个被拒绝的正好是2019年牵头作B&R报告的分析师,这可能是直接导致2019年Rubrik排名不好,Rubrik跟Gartner怼起来的原因,当然都是江湖传闻)
我们从技术特点上来看,Rubrik给人最印象深刻的是以下2点:
1.基于自研的分布式文件系统,构建数据流动、存储、缩减、复制,简化了备份软件(软件生态扩展更快),拓展了销售空间(卖存储,非纯软件),这是传统备份软件不具备的
2、以基于生产环境检索、以被保护环境为中心及智能SLA(传统BR系统都是以策略为中心来选定被保护环境)、强大和灵活的报表系统,大大加强了易用性。
最后来看看2021年Gartner对Rubrik的评价:
三大优势:
1. 统一管理。可以对部署在本地,云环境搞中保护IaaS实例或者SaaS应用的多个Rubrik集群进行统一管理,并且可以提供集的安全性和工作流管理。
2.通过UI可以简化操作,并且提供丰富的API已被第三方集成实现深度的自动化。
3. 对SqlServer,Oracle等数据库和NoSQL的支持较好。支持SQLServer,Oracle的即时挂载恢复,支持SQL Server的CBT永久增量备份。
三个值得改善的地方:
1. SaaS应用支持弱,不支持SalesForce和Google Workspace。
2. 在公有云场景下,有额外的计算资源开销,增加成本。因为RCDM需要部署4个节点的虚拟机集群来实现云环境中的细粒度恢复和数据库保护。但是备份系统运行在云中这种情况下,对于保护非云环境的应用来讲,增加了计算资源的开销。
3.对于新兴地区市场还未直接覆盖,只能依赖于合作商触达,交付和服务能力受到限.
总体来讲Rubrik的上位非常快速,复盘下至少有几个原因:
1. Rubrik诞生于IT设施正往云上大规模迁移的时代,没有历史包袱不用去做大量的工作去全面兼容以前的“老系统”比如各种版本的UNIX,各种小型机,这些兼容性是传统厂商多年积累起来的优势,但是在云原生大趋势下,逐渐消失,对于Rubrik的后来者,这无疑是少了很多工作。
2.得益于团队的积累,创始团队几个核心人员都是大厂背景技术出生,对于产品所用到的技术能力有一定的积累,能快速启动。
3.资本起到了助推作用。通过几轮融资,技术、市场能力可以快速补充,几次并购直接就补充了产品能力短板。既带了资金又带了资源的业内老江湖和专业投资机构的投资对于公司发展推动是毋庸置疑的。
Rubrik将去向何方?
为了回答这个问题,特意挖掘了一下近两年Rubrik的发布动向。
以下是近2年来一些主要发布的功能特性:
2020.4发布版本
针对VMware的备份和恢复性能增强
对Oracle的备份和恢复功能增强,主要是加强了克隆功能用于测试/开发场景,增加对Oracle各种版本的兼容性
增强了角色访问机制和法规遵从要求,增强了对备份数据保留策略的安全性
2020.11发布版本,主要做了以下增强:
安全性方面增强:
加强在被勒索病毒软件攻击等场景下的应用自动化恢复能力
加强与Palo Alto Networks® Cortex XSOAR等第三方的集成
双因子认证
提供用户的行为分析,进行可以操作探测,增强安全性
提供全局的数据视图,更快更精确的评估受到损坏的应用和数据范围
容灾(DR)功能增强
通过appFlows来提供将主站点的应用和相关管依赖在灾难发生时迁移至云环境中
对应用保护的增强,特别是云和SaaS应用
这里就不一一列了,内容比较多,比如多office365保护,对超融合设备一些特性增强以等
2021.8 获得微软战略投资,在对Azure环境的保护和勒索病毒增强上面进行增强
2021.11 发布S3的WORM功能,主要是完善勒索病毒防御,增强安全性
2021.12 针对数是云和SaaS的应用发布了功能增强的特性:
增加对Azure-Sql的保护,AWS-S3归档数据恢复增强
对Azre和AWS虚拟机保护保护时快照使用优化,降低费用
对Microsoft 365的保护增强
对数据库的保护进行增强
IBM POWER环境下对SAP HANA数据库保护
Oracle和SQL数据库的恢复性能优化
对Nutanix AHV虚拟化环境保护增强
2022.2
新发布的特性主要还是围绕着云中应用的保护、勒索病毒以及敏感数据的保护几个方向:
GDPR:提升了PII等敏感数据分析及风险发现的速度
防勒索病毒方面:优化恢复过程,避免在恢复过程中感染勒索病毒
应用增强方面:增强了对Splunk实例的保护支持
主线脉络还是比较清晰,有三条:
1.加强对已有的功能优化,比如Vmware的性能优化、对Oracle、SQL等数据库的保护优化。
2.对云及云原生应用的保护加强。比如对AWS及应用的保护。又比如获得微软风投,双方微软Azure进行一系列的深度合作,对office365的保护等。
3.对数据安全性的加强。比如针对勒索病毒的防护、对敏感数据的保护等,满足法规遵从需求。
最后的最后,一本正经胡说八道的推测一下后续Rubrik的有可能的发展方向,可能有以下几点吧:
1.首先应该是补齐弱点,加强对SaaS类应用的支持,毕竟这是趋势,也是传统厂商目前还没有明显优势的地方。
2.对传统应用或与第三方的设备特性深度结合,比如在性能、成本、功能易用性上面做一些更深度的结合,提供更有特色的方案,属于竞争力补齐。比如与NetApp的设备结合利用硬件的一些能力提升性能、与Azure生态,与ServiceNow等寻求被集成,从而融入更广的生态和更多的机会场景。
3.在数据管理的方向上深入,在数据安全、法规遵从上面优化现有方案,比如在如何挖掘和利用备份数据的价值上做文章,或者与应用加深融合,针对常见应用提供更多有特色的功能。这部分也是想象空间最大的。
这个新的大佬将去向何方?拭目以待。
参考材料来源:
www.rubirk.com
https://www.youtube.com/watch?v=A4fB0aKFNME
《 The Definitive Guide to RubrikCloud Data ManagementTECHNICAL 》
《Protecting Unstructured Data》
《Backup & Recovery Best Practices 2021 Ebook》
《Magic Quadrant for Data Center Backup and Recovery Solution》