用户头像
美丽的邂逅
 · 广东  

$Rubrik(RBRK)$ $英方软件(SH688435)$

长篇好文裁剪转发,//后为个人解读;

Rubrik一家敢硬刚Gartner的数据保护独角兽 作者 Joe 时间:20220306

.....

Rubrik是成立于2014年的一家美国公司,总部位于美国加州的帕罗奥托,几个核心创始人来自Nutanix,Exadata和Google,都是业内人士。投资人中有几个就更有趣了,都是些老江湖,思科前CEO,Symantec的前CEO,还有DataDomain的前CEO,和Veritas的创始CEO(Vertitas不用多说了吧,OG中的OG咯。)这几位作为投资人投资Rubrik无疑会给公司带来很大助力,在人才引进、收并购、市场客户拓展方面应该也有不少助力。

Rubrik的自我定位

slogan:“Unlock the Power of Data by Organizing and Protecting the World's Business Information”。可看出两层意思,

一、目标是“Unlock the power of data”,解决传统灾备数据利用率低的问题。将备份数据除了在灾难发生时用于恢复之外,还能更多利用备份数据发挥出数据的价值。

//在AI时代,备份数据的价值会不断被挖掘与放大,对英方软件这类容灾备份公司,这点极其的重要,大幅提升容灾、备份对于客户能够带来的价值,就是自身价值的大幅提升。

二、通过组织和保护商业信息(Organizing and Protecting the World's Business Information)来实现目标,是Rubrik对自己现在做的事情的高度总结,Rubrik主要产品可概括为一个软件平台,可在跨数据中心和云的安全架构中提供备份、即时恢复、归档、搜索、分析、合规性和副本数据管理等功能,就是通过这些实现 “Unlock the power of data”。

//对比英方软件目前产品,对于数据的搜索、分析、洞察这方面目前好像没有。也就是对于备份数据价值挖掘部分,还缺少落地产品,这点后续可以跟公司沟通了解下,是否有规划?

Rubrik市场地位

2014年创立,2017年已出现在visionaries象限里面了,成立以来进步神速,在2020,21年连续2年都已经在《Magic Quadrant for Enterprise Backup and Recovery Software Solutions》魔力象限中的领导者象限。这个成长速度相当不错,能进入Gartner的厂商至少产品年销售收入方面需要达5千万美刀或者年收入2.5千万美刀但增长大于20%或订阅模式每年收入2.5千万美刀。除收入还要在售前支持,交付,渠道建设,对市场客户理解等方面都有要求,对于初创企业要快速到达这些要求还是有些难度的。

//英方还要努力,按以上条件,今年都还无法进入魔力象限。对于IT软件类公司,进入这个清单,特别是进入领先象限,对于TO B软件来说,对于拿单还是很有帮助的。但已接近进入了

Rubrik融资和并购回顾

看看Rubrik在魔力象限中的走势,在成立短短几年能做到现在这样还是非常不错的,除团队本身业务底子好而外,Rubrik的快速发展,资本市场也给予了较大的帮助。

来看下Rurik的融资和收购历史:

2015年B轮融4100万美刀,2016年C轮融6100万,2017年D轮融1.8亿,估值13亿,2019年E轮融2.61亿、估值33亿美刀,2021年微软投了Rubrik估值大概40个亿,没透露投资金额,大约是千万级美金。微软投资Rubrik主要是目的是聚焦 Microsoft 365、混合云数据保护和集成云服务,并基于Microsoft Azure共同开发和营销零信任数据保护解决方案。几年时间,这个融资能力和节奏妥妥的独角兽

//英方软件2023年初IPO融资约8.1亿元,跟rubrik2021年前5亿多美金,还是有较大差距哈。

有了钱,就可以买买买了,Rubrik收购其他公司来快速补足自己产品能力的短板。公开信息可以看到的Rubrik有三起比较典型的收购:

//并购是外资企业发展壮大极其常规的手段,国内这方面其实总体差距非常大。有些非常适合并购的行业,并购整体来讲,数量及规模都比较有限。当然,更多行业可能并不适合并购

2018年收购了Datos IO,通过收购获得了NoSql类型数据库和大数据平台的保护能力,现在的Mosaic就是基于收购研发的产品;

2020年收购了Igneous,这是一家专注于NAS数据管理的企业,擅长处理PB级非结构化数据。通过收购提升了海量非结构化数据备份恢复的能力,实现基于快照的永久增量备份,海量文件的索引能力、解决了传统NDMP方式去备份NAS的缺点。

2020年底还收够了Opas AI 。通过收购除了获得产品能力,同时也获得了这些公司的客户。

Rubrik能在成立的短短几年产品发展迅速其背后资本起到了很大的助推。

二、Rubrik产品三大件

Rubrik的主要产品三大件 RCDM、Polaris、Mosaic

Rubrik的主要产品组合是Rubrik Cloud Data Management,这是该公司核心平台,Polaris是SaaS的集中管理平台(类似于NBU的OpsCenter)同时扩展了勒索软件防护、数据恢复、数据分类功能,Mosaic主要用于保护NoSQL类数据库。

Rubrik Cloud Data Management(RCDM):由4个核心组件组成:

Atlas Cloud-Scale File System:分布式文件系统,用于存储和管理各版本的备份数据。号称6有大特性:

单点故障,基于EC的容错性,主要是通过纠删码对数据进行智能编码和分区,在单节点或者2个磁盘异常的情况下仍然能重构原始数据。

纠删码在提升了可用容量的同时还保持了高性能。自学习和自修复(Self-learning and self-healing):在发生故障的时候能自动的调整和重新平衡,以保证系统的弹性。可线性扩展:支持可无限线性扩展,通过往集群中添加节点实现性能和容量的提升。Zero-byte clone:支持通过“黄金映像”克隆多份数据(虚拟快照)。可加速测试和开发,也可以用于即时恢复和业务连续性保障。

智能的数据缩减:可智能的进行数据缩减,减少本地或云上的带宽和存储消耗Flash-optimized:主要是通过个闪存加速和机械盘混合的硬件服务器架构,优化IO吞吐量。这是RCDM的一体机设备硬件平台提供功能的。

这些特性里面,通过公开资料描述来看,看不出有啥特别过人之处,大多友商都有这些特性,主要表达的就是给RCDM的提供了扩展性、高性能、高可靠性,重删功能和虚拟快照功能,虚拟快照就是CDM(Copy Data Management)的核心,通过这个可以实现即时恢复。

Callisto:分布式元数据系统:Rubrik 的分布式元数据系统Callisto与 Atlas Cloud-Scale File System 配合,以提供可高速访问的全局索引和目录以进行文件级搜索。它旨在提供无单点故障的持续可用性、线性可扩展性和操作简单性。即便在多个节点故障的情况下,系统仍可以保持对元数据的持续访问搜索。

Cerebro: 数据管理层,这是RCDM的大脑,用于处理从数据的摄取至数据过期整个全生命周期的数据管理,由Blob引擎(Blob Engine)和一个分布式任务框架构成(Distributed Task Framework)。

Blob引擎:提供核心数据管理服务,包括不变性、数据缩减、保留、复制和归档。Blob Engine采用不可变格式(immutable format )去获取所有数据和应用程序,并加密备份数据以防止勒索软件等破坏。同时,Blob引擎还负责建立索引相关的元数据,如文件名、类型和内容,以构建单个元数据存储库,以便支持跨应用程序、数据中心和云的全局文件级搜索。

另外Blob引擎智能地应用全局数据缩减,同时支持快速数据重建,以在数据生命周期的所有阶段最大限度地提高存储效率,最后Blob还负责SLA策略,将过期的快照标记为可安全删除,还可为终端用户提供报告来跟踪合规性。

分布式任务框架(Distributed Task Framework):分布式任务框架在 Rubrik 集群中全局分配和执行任务,自身具有高可靠性. 它应用智能算法进行负载平衡和通过两种方法模型优化资源利用率:任务调度(Task Scheduling)和任务维护(Task Maintenance)。

任务调度确保任务在集群中均匀分布,而任务维护的主要功能是按每天和长期的方式进行SLA策略调度。 一旦设置了 SLA 策略,任务维护就会根据制定的策略来满足既定目标,如数据保留周期、复制和归档。Infinity:该组件主要是对外的接口和实现应用感知。主要就是与外部生态系统进行交互,以便让Rubrik平台感知应用。该层通过 API、连接器和其他协议,以确保 Rubrik 可以发现并有效保护任何受支持的对象。 第三方可以通过这类接口来集成Rubrik,比如将Rubrik集成到数据库自身的管理维护界面,方便DBA来维护数据库。

第二大件,Rubrik产品组合中另外一个重要成员,Polaris,是SaaS平台,可将分布在各个环境中的用户数据建立起统一的元数据管理组织框架,实现不同环境数据的统一管理。

Rubrik通过这样建立起用户环境数据的统一元数据记录,提供勒索病毒感染文件的恢复,减少敏感数据的暴露风险,关于勒索病毒防护主要是RCDM对于备份数据采用不可变(immutable format)的格式来存储,防止了勒索软件加密覆盖数据,此外结合Polaris Radar来检测元数据是否被匿名访问或者可疑操作来预警。另外还可以通过Polaris对Rubrik分布式环境实现统一管理和云原生环境的保护,比如对Microsoft Office 365, OneDrive, IaaS workloads on Microsoft Azure VMs, Google Cloud Platform VMs, Amazon EC2实例, EBS卷, RDS实例的保护。

第三件是Mosaic主要是与RCDM一起实现对NoSQL数据库的保护。通过Mosaic可以对NoSQL实现应用一致性的备份和永久增量的备份,还可以实现比较细粒度的恢复,比如对数据库中某列族,按照某个时间范围进行恢复等特性,支持恢复至异构运行环境。这是前面提到过的,从Datos IO收购整合来的能力。

下表对Rubrik的功能特性做了一个简单总结,要想更进一步了解Rubrik的每种特性或者应用保护的方案介绍可以访问其官方网站www.rubrik.com,每种解决方案Rubrik都提供了介绍。

功能特性说明架构集群架构,支持物理一体机部署和云环境部署数据库保护支持Oracle(支持即时恢复), SQL Server(支持即时恢复), SAP HANA, MySQL, PostgreSQL, MongoDB, Cassandra databases,物理环境Windows, Linux, Unix (IBM AIX 、 Oracle Solaris),对于windows通过VSS可以实现数据一致性的备份,并且可在兼容的硬件平台上实现裸金属恢复,也可恢复至云环境虚拟环境支持Vmware(支持即时恢复)、Hyper-V(支持即时恢复)、Nutanix云环境AWS,Azure,Google CloudSaaS应用Microsoft 365NAS与 Dell EMC Isilon,NetApp FAS, Pure FlashBlade, and Qumulo进行了API级别的集成提供更好的适配。Rubrik的NAS Cloud Direct的主要是通过多线程并发将大文件拆分、将小文件合成大数据块来提升性能解决海量非结构化数据备份的问题。其他特性支持重删、法规遵从、防勒索病毒,CDP,远程复制,CloudOut(归档至云上),CloudOn(恢复至云上),一体机支持缓存加速,API接口开放可被集成

Rubrik的支持两种订阅模式版本,一种是Rubrik Go,一种是Rubirk Complete Edition,每种又分几种小版本,版本之间就是一些功能授权不同。都是按照三年订阅模式授权。

三、老的江湖,新的大佬

从2017年进入Gartner魔力象限到2021年一年不落,而且连续两年在领导者象限,这个新来的势头很猛,已成为江湖大佬,甚至敢叫板Gartner了。(2018年Gartner未发B&R魔力象限,这是一个对Gartner来说悲伤的故事,搞B&R的4个分析师被Rubrik挖走,1个被Veeam挖走,直接导致2019年都是新安排分析师来做B&R的报告。据说还有一个分析师求职Rubrik被Rubrik拒绝了,这个被拒绝的正好是2019年牵头作B&R报告的分析师,这可能是直接导致2019年Rubrik排名不好,Rubrik跟Gartner怼起来的原因,当然都是江湖传闻)

从技术特点上来看,个人认为Rubrik给人最印象深刻的是以下2点

1.基于自研的分布式文件系统,构建数据流动、存储、缩减、复制,简化了备份软件(软件生态扩展更快),拓展了销售空间(卖存储,非纯软件),这是传统备份软件不具备的

2、以基于生产环境检索、以被保护环境为中心及智能SLA(传统BR系统都是以策略为中心来选定被保护环境)、强大和灵活的报表系统,大大加强了易用性。

最后来看看2021年Gartner对Rubrik的评价:

三大优势:

统一管理。可以对部署在本地,云环境搞中保护IaaS实例或者SaaS应用的多个Rubrik集群进行统一管理,并且可以提供集的安全性和工作流管理。

通过UI可以简化操作,并且提供丰富的API已被第三方集成实现深度的自动化

对SqlServer,Oracle等数据库和NoSQL的支持较好。支持SQLServer,Oracle的即时挂载恢复,支持SQL Server的CBT永久增量备份。

三个值得改善的地方:

SaaS应用支持弱,不支持SalesForceGoogle Workspace

公有云场景下,有额外的计算资源开销,增加成本。因为RCDM需要部署4个节点的虚拟机集群来实现云环境中的细粒度恢复和数据库保护。但是备份系统运行在云中这种情况下,对于保护非云环境的应用来讲,增加了计算资源的开销。

对于新兴地区市场还未直接覆盖,只能依赖于合作商触达,交付和服务能力受到限制。

所以总体来讲Rubrik的上位非常快速,复盘下至少有几个原因:

Rubrik诞生于IT设施正往云上大规模迁移的时代,没有历史包袱不用去做大量的工作去全面兼容以前的“老系统”比如各种版本的UNIX,各种小型机,这些兼容性是传统厂商多年积累起来的优势,但是在云原生大趋势下,逐渐消失,对于Rubrik的后来者,这无疑是少了很多工作。

//国内企业未来主要用国内云,对于英方软件,可能相对来讲是有优势的。

得益于团队的积累,创始团队几个核心人员都是大厂背景技术出生,对于产品所用到的技术能力有一定的积累,能快速启动。资本起到了助推作用。通过几轮融资,技术、市场能力可以快速补充,几次并购直接就补充了产品能力短板。既带了资金又带了资源的业内老江湖和专业投资机构的投资对于公司发展推动是毋庸置疑的。

Rubrik将去向何方?

为了回答这个问题,特意挖掘了一下近两年Rubrik的发布动向。

以下是近2年来一些主要发布的功能特性:

2020.4发布版本

针对VMware的备份和恢复性能增强对Oracle的备份和恢复功能增强,主要是加强了克隆功能用于测试/开发场景,增加对Oracle各种版本的兼容性增强了角色访问机制和法规遵从要求,增强了对备份数据保留策略的安全性

2020.11发布版本,主要做了以下增强:

安全性方面增强:加强在被勒索病毒软件攻击等场景下的应用自动化恢复能力加强与Palo Alto Networks® Cortex XSOAR等第三方的集成双因子认证提供用户的行为分析,进行可以操作探测,增强安全性提供全局的数据视图,更快更精确的评估受到损坏的应用和数据范围容灾(DR)功能增强通过appFlows来提供将主站点的应用和相关管依赖在灾难发生时迁移至云环境中对应用保护的增强,特别是云和SaaS应用

这里就不一一列了,内容比较多,比如多office365保护,对超融合设备一些特性增强以等

2021.8 获得微软战略投资,在对Azure环境的保护和勒索病毒增强上面进行增强

2021.11 发布S3的WORM功能,主要是完善勒索病毒防御,增强安全性

2021.12 针对数是云和SaaS的应用发布了功能增强的特性:

增加对Azure-Sql的保护,AWS-S3归档数据恢复增强对Azre和AWS虚拟机保护保护时快照使用优化,降低费用对Microsoft 365的保护增强

对数据库的保护进行增强

IBM POWER环境下对SAP HANA数据库保护Oracle和SQL数据库的恢复性能优化对Nutanix AHV虚拟化环境保护增强

2022.2

新发布的特性主要还是围绕着云中应用的保护、勒索病毒以及敏感数据的保护几个方向:

GDPR:提升了PII等敏感数据分析及风险发现的速度防勒索病毒方面:优化恢复过程,避免在恢复过程中感染勒索病毒应用增强方面:增强了对Splunk实例的保护支持

主线脉络还是比较清晰,有三条:

加强对已有的功能优化,比如Vmware性能优化、对Oracle、SQL等数据库的保护优化。对云及云原生应用的保护加强。比如对AWS及应用的保护。又比如获得微软风投,双方微软Azure进行一系列的深度合作,对office365的保护等。对数据安全性的加强。比如针对勒索病毒的防护、对敏感数据的保护等,满足法规遵从需求。

最后,一本正经胡说八道的推测一下后续Rubrik的有可能的发展方向,可能有以下几点吧:

首先应该是补齐弱点,加强对SaaS类应用的支持,毕竟这是趋势,也是传统厂商目前还没有明显优势的地方。

对传统应用或与第三方的设备特性深度结合,比如在性能、成本、功能易用性上面做一些更深度的结合,提供更有特色的方案,属于竞争力补齐。比如与NetApp的设备结合利用硬件的一些能力提升性能、与Azure生态,与ServiceNow等寻求被集成,从而融入更广的生态和更多的机会场景。

数据管理方向上深入,在数据安全、法规遵从上面优化现有方案,比如在如何挖掘和利用备份数据的价值上做文章,或者与应用加深融合,针对常见应用提供更多有特色的功能。这部分也是想象空间最大的。//的确如此