春节假期快结束了,西瓜哥在这给大家拜个晚年,猪大家晚年幸福。
好久没有更新公众号了,主要是最近有点忙。到美国一段时间了,忙着学习德州的交规,昨天刚通过了笔试,下周还有考路试。在达拉斯这个大农村住,没有公交(这个国内就方便多了),不开车根本出不了门(当然,有钱你可以每次叫Uber),因此,第一件事就是考驾照了。昨天去附近的DPS(Department of Publice Safty)办驾照,体会了一下美国的电子政务,感觉中国这块做得比美国(最少比德州)好。据说很多人都需要排几个小时队,我看了Google的评论,基本上都是抱怨连天。网站的预约系统其实每天7点可以预约当天的号,据说有60个号可以预约。但是网站没有任何说明,因此,很多人上班时间再预约总是没有号了,让人怀疑预约就是一个摆设。如果没有预约,需要在室外排队(不管刮风下雨,严寒酷暑),因为室内空间有限。很奇葩的是其取号机在室内,只能进屋后才能取号,使得民众抱怨连天。其实只需要做一个小改进,把取号机放门口,所有人来了就可以取号,然后在自己车里等。然后搞一个动态网页,实时刷新当前处理的号码信息。这样大家都不用排队,在车里刷刷手机,体验肯定要好多了。
不扯远了,我原来说了,在海外,只要有时间,我还是会关注存储圈的信息,继续给大家解读存储圈的事。海外比较好的一点是,不用翻墙看科技类的网站,还是方便得多。
现在,我正在我家领导打工的Meccha Matcha抹茶店等她下班,一块参加晚上的西电达拉斯校友新春聚会,正好有点时间,和大家聊聊Gartner最近对基于控制器的外部存储(ECB)的一些调整,就当做我新春后的首发吧。
据西瓜哥得到的信息,自2019年6月起,Gartner将针对市场份额和预测报告修改其基于外部控制器的存储分类,引入第二存储的内容。
以后Gartner的ECB( external controller-based )存储,将采取新的分类方法,分成3大类。
主存储(Primary Storage)
第二存储(Secondary Storage)
备份/恢复设备(Backup/Recovery Appliances)
另外,下面的分类,Gartner以后也不再跟踪了:
Data access protocol (DAP) 1
DAP 2
DAP 3
Scale-out
Scale-up
File-based, network-attached storage (NAS)
Block-based storage area network (SAN)
Unified gateway
Just a bunch of disks
Price band
也就是以后看不到NAS,SAN还有Price Band这些信息了。
Gartner为什么做这些改变,主要就是市场变化太快,比如现在大部分的存储都是统一存储,其SAN和NAS的比例很难分出来的。而现在第二存储和备份一体机又那么火,加入进来也是很多客户的需求。
跟踪和预测更有意义的细分市场,客户将能够更清晰,更准确地查看历史并预测ECB市场的未来。
不过,我觉得大家最应该关心的不只是这些变化,而是Gartner是如何定义这三大类存储的。特别是第二存储,业界有不同的理解,Gartner是怎么定义第二存储的呢?
主存储定义
ECB主存储阵列的首要目的是支持响应时间和每秒输入/输出(IOPS)敏感的结构化数据工作负载。典型用例包括任务关键型工作负载,如IBM Db2,Microsoft SQL,Microsoft Exchange和SharePoint,Oracle数据库和应用程序,SAP HANA以及内部开发的事务性应用程序。主存储平台提供广泛的数据服务,可以提高容量利用率,防止数据丢失,并通过本地和远程复制增强恢复能力。存储介质可以是固态驱动器(SSD)或硬盘驱动器(HDD)或两者的组合。外形尺寸可以是向上扩展(scale-up)或向外扩展(scale-out)。主机接口协议可以是基于块的(FC, iSCSI),基于文件(NFS, SMB),或块和文件协议的组合。对于固态阵列(SSA),主机接口也可以NVMe-oF。
混合HDD / SSD和SSA ECB系统将作为此类别的子分段进行单独跟踪。
第二存储定义
ECB第二存储阵列的首要目的是经济高效地支持延迟和IOPS不是必需属性的非结构化数据工作负载。典型用例包括长期归档,大数据分析应用程序的存储库,深度历史研究以及备份/恢复软件的备份/恢复目标。介质主要是HDD,但也可以是SSD。选择的外形尺寸是横向扩展(scale-out)。访问协议包括RESTful HTTP API,例如Amazon Simple Storage Service和OpenStack Swift,以及支持NFS和SMB协议的分布式文件系统。对于SSA,主机接口也可以是NVMe-oF。
混合HDD / SSD和SSA ECB系统将作为此类别的子分段进行单独跟踪。
备份/恢复设备定义
ECB备份/恢复设备专门用于支持备份/恢复处理。这些平台将越来越多地包括集成到设备中的备份软件。媒体主要基于HDD,但也可以是基于SSD或两者的组合。备份/恢复设备可用作向上扩展或向外扩展的体系结构,但在绝大多数情况下,将用作支持基于文件或基于对象的数据访问协议的横向扩展体系结构。
混合HDD / SSD和SSA ECB系统将作为此类别的子分段进行单独跟踪。
看完Gartner的定义,我们看到,主存储就是关键业务的存储,第二存储指针对非关键业务的非结构化数据的存储,而且应该是Scale-out架构的。置于备份/恢复设备,主要是设备里面集成了备份恢复软件就算。
因此,Gartner的第二存储这个定义,和西瓜哥以前常讲的第二存储还是有些不同的(参见存储新风口——超融合第二存储来了)。因为我以前是把第二存储和scale-out形态的备份一体机都算成第二存储了。
按照Gartner定义,Cohesity应该是第二存储,但如果包含数据保护模块就是备份/恢复设备,而Rubrik,只能算备份/恢复设备,不能算第二存储。
大家知道,原来是Cohesity拿的钱最多,但现在Rubrik最近又拿了2.61亿美金,融资总额已经超过了Cohesity。
但是,我的观点还是没有变,Cohesity的形态我更喜欢,更看好。因为Cohesity可以是第二存储,也可以是备份/恢复设备,但Rubrik只能在备份领域玩,那么市场空间一下少了很多。
既然Gartner对第二存储有了明确的定义,未来为了统一口径,我估计也要向Gartner靠拢了。Rubrik这种形态,我就叫备份/恢复专用第二存储(只能做备份恢复),而Cohesity,就叫超融合第二存储,大家觉得如何?