Vast Data 公司成立时间不长,但已在瞬息万变的数据存储市场上崭露头角。公司由首席执行官 Renek Hallak、研发副总裁 Shachar Fienblit 和产品副总裁 Jeff Denworth 于 2016 年创立,他们共同看到了改变 HPC 组织和大型企业存储和访问海量数据方式的机会。
他们利用闪存、NVM-Express 存储协议、NVM-Express-over-Fabrics 扩展和存储级内存 (SCM) 等技术,创建了他们所称的通用存储(Universal Storage)--一种分布式架构,使企业在计算存储需求时不必在成本和容量之间做出决定,也无需再对数据进行传统的分层。
"Denworth 告诉 The Next Platform:"我们开始意识到,可以在一个环境中构建一个存储系统,基本上可以支持所有应用和所有工作负载的需求。"性能和容量的范围并不需要在存储层面上体现。它可以体现在应用层面上,每套不同的应用都会根据自己的需要消耗或多或少的容量。如果你有存档应用和高性能应用,它们就可以在一个系统中共存,这个系统不是为每个固态硬盘的绝对性能而设计的,而是为你提供足够的总体性能,以满足你所有工作负载的需求。
Vast Data 在 2018 年之前一直处于隐身模式,2019 年初开始推出其存储硬件和软件。该公司的发展速度很快,2021 年 5 月,它拉到了 8300 万美元的 D 轮融资,将 Vast 的估值推高到 37 亿美元,并创造了 2.3 亿美元的资产负债表。据 Denworth 称,这家拥有 300 名员工的公司的年化收益率超过 1 亿美元,同比增长 350%,业务遍及五大洲。
然而,Vast 创始人的计划并不是创建一家存储数据公司。Denworth 认为,他们的想法是建立新一代的基础设施。他提到了 Thinking Machines 公司,这是一家成立于 1983 年的公司,旨在建造高度并行的超级计算机,以利用当时的人工智能技术,与 Cray 和 nCUBE 等公司竞争。Thinking Machines 曾有过几年的盈利期,但最终在 10 多年后申请破产,Sun Microsystems 收购了其硬件和并行计算业务。
公司短暂的生命给 Denworth 和 Vast Data 的其他联合创始人留下了深刻的影响。Thinking Machines "是一家非常定制化的超级计算公司,致力于制造一些非常有趣的系统,而且随着时间的推移,"他说。他说:"这也是我们的最终目标:一个最终能够自我思考的系统。但在开始时,我们希望以我们的根基为基础--包括 XtremeIO、DataDirect Networks 和 Kaminario(现更名为 Silk)--我们说:'好吧,让我们从建立数据存储开始吧。'我们的想法是,让我们对如何建立一家公司和如何建立系统的每一个要素都提出质疑,这样我们就能从这项工作中获得最大的收益,既包括产品所能实现的目标,也包括公司的外观、组成和估值。
登沃斯表示,公司将在今年晚些时候的一次大型活动上公布其十年愿景,届时将具体介绍公司的计划。
"他说:"我们希望展示我们正在做的第一件事的证据,以证明我们认为我们可以做得非常特别。"我们一直以来的目标是让一切变得更简单,让客户能够建设价值更高的基础设施。与传统架构和传统系统相比,更多的实用性能解决更多的问题,并利用我们今天推向市场的发明来支付我们明天要推向市场的发明,或支付开发本身的费用。这就是它的要点。
他说,Vast Data 将自己视为一家数据公司。纵观现有的各种存储系统,有些比其他系统更智能、更先进。
"文件系统比块存储系统或 J-Bots 更先进,而你所拥有的基本上是数据管理系统,"Denworth 说。"我们意识到,我们可以让文件系统远远超越文件系统的经典定义,但我们意识到,对数据有最深入了解的架构可以就如何处理这些数据做出最佳决策。首先,确定数据的内部结构。其次,要么将数据移到计算所在的地方,要么将计算所在的地方移到数据所在的地方,这取决于在任何给定的时间内最优化的决策是什么"。
有一种 "经典的 IT 堆栈,基础设施团队一直在运行,如 VMware、甲骨文和 EMC 等产品,"他说。他说,"这对传统的 IT 应用很有好处。我们的论点是,未来20年将由计算复兴来定义,而人工智能在市场上的应用无疑是其中的标志性事件。"
Vast 的推出恰逢人工智能、机器学习和深度学习的采用率不断上升,所有这些都需要访问尽可能多的数据。该厂商在 "分解共享一切"(DASE)架构中的巨大闪存池可在几毫秒内提供所有数据。在这些环境中,不再需要分层。
"机器学习彻底改变了客户与数据之间的关系,为了适当地训练和重新训练模型,你必须一次又一次地回到容量存储中,"Denworth 说。Denworth 说:"昨天的高性能存储行业进行了优化,以捕捉交易,比如当你刷信用卡时。但在未来,你将为了解整个宇宙的可能性而进行优化,而这只能通过让这些新算法接触到最大量的数据来实现。随着数据的老化,它在这个时代变得更有价值,这就颠覆了数据金字塔特质的概念"。
随着 Vast Data 制定下一个十年的路线图,它将继续发展其数据存储产品组合。正如我们去年所写,Vast Data 退出了硬件业务,将软件与其设备分离,并与合同制造商安富利(Avnet)合作。Denworth 表示,此举耗时约八周,与 Nutanix 等业内其他公司的转变如出一辙,将硬件从供应商的账面上剥离,为企业提供了更多运行软件的硬件选择。
他说,在未来六到十二个月内,Vast Data 可能会有两到三个原始设备制造商合作伙伴,也可能会有一家云计算提供商自己制造产品,但他拒绝透露这些公司的名称。
最近,该公司上个月将Vast通用存储软件支持的硬件平台的存储密度提高了一倍。Vast Data公司正在利用英特尔的30 TB四级单元(QLC)固态硬盘提高2U Vast Enclosure(DBox)的密度,为企业、超大规模和云环境提供每机架单元超过1PB的容量。现在,该机箱可支持高达 1,350 TB 的闪存容量,为了提高能效,该架构的每 PB 功耗为 500 瓦。此外,Vast Data 今年还将推出一项新的 UPC 功能,通过智能调度 CPU 来限制系统功耗,从而将峰值功耗降低 33%。
这也是 Vast Data 更大使命的一部分,即降低闪存成本,让硬盘变得不再重要。这可能说起来容易做起来难。据 IDC 分析师称,虽然面对 SDD 攻击率的上升,HDD 市场将继续下滑,但到 2025 年,HDD PB 出货量每年将增长 18.5%,每块硬盘的平均容量每年将平均增长 22.5%。
存储厂商也在寻找利用硬盘的新方法。西部数据(Western Digital)去年推出了 OptiNAND,这是一种将 iNAND 通用闪存与硬盘整合在一起的新技术,以应对日益增长的数据量。