ESG 调查发觉,成本问题始终是制约布署基于c盘备份方案的首要诱因。而重复数据删掉技术增加了前端c盘容量需求,从而减少了相关c盘成本(参见图2)。
随着许多新技术的出现,市场上对重复数据删掉技术的理解有些混淆。事实上,最近的一份ESG调查2表明,不同规模的公司机构和行业对重复数据删掉有着浓郁的兴趣和相当的了解。ESG觉得在采用曲线上,早期对重复数据删掉的浓郁兴趣表明在市场上对其概念的混淆(什么构成了重复数据删掉)或者表明重复数据删掉具有强悍的吸引力,将其与出现的其他技术区别开来,使其打破典型技术采用曲线规则。重复数据删掉技术是显而易见的,不依赖于应变量而被广泛采用。ESG同时预测重复数据删掉技术将在今年及后年被广泛采用。
在前面内容中,我们将全面述说重复数据删掉技术,并回答以下问题:
#8226; 什么是重复数据删掉?在数据保护计划中处于何位?
#8226; 重复数据删掉和其他备份方式或技术有这些不同?
#8226; 重复数据删掉有什么优势?
#8226; 怎样执行重复数据删掉?
最后,我们将述说昆腾DXi系列c盘备份和复制设备,昆腾的重复数据删掉形式以及其可能为您的数据保护环境所带来的益处。
定义重复数据删掉
先看一个简单的定义。ESG将重复数据删掉定义为删掉或擦去冗余文件、字节或数据块的流程,确保只有“独有”的数据储存在c盘上。重复数据删掉也是ESG所谓的容量优化保护技术(COP)的一个例证。COP技术用于降低数据保护相关的容量需求。
重复数据删掉拥有许多潜在优势,最独特的一点则是,重复数据删掉通过有效降低前端容量需求,正面解决了“容量膨胀”问题。图3给出了相关图释说明。
在此图中,重复数据用多个相同颜色的袋子来表示。然而重复数据删掉细度或效率(能够测量多少重复数据)会按照应用或数据类型而变,底线是相同颜色方块(参见前面图释)有效降低。
重复数据删掉处理的细度越多,容量降低的越大。总体来看,文件级的重复数据删掉其实有效,但其测量的重复数据要多于块级或字节级的重复数据删掉;同样,块级重复数据删掉在检查数据重复上比字节级的重复数据删掉一般更有效。
下面反例说明在细度上的差异:某终端用户制做了1MB的PowerPoint演示文档,然后以电邮附件方式发给内部20个人审读。在传统备份环境下(没有重复数据删掉)pst文件删除邮件后容量没有变小,虽然文件没有任何变化,但每位附件就会在晚上完全备份过程中被全部备份,耗费不必要的c盘容量(20×1MB)。即使是小公司,考虑到c盘化学容量、功率和冷却等情况,此冗余成本也颇为可观。
然而,文件级重复数据删掉只保存一份PowerPoint文档备份,所有其他附件(如重复的拷贝)都被“指针”替代,从而释放磁盘空间容量,并在顾客须要的情况下延长保留时长。
更多细度的重复删掉方式,块级和字节级重复数据删掉技术将此流程加快一步。这些技巧查看构成新1MB文件的每位片断,与重复数据删掉系统原本遇见的元素相比较,在新文件中用表针取代重复元素,而不用重新储存。(不同厂商在处理流程上有所不同。在有些情况下,产品的性能可能遭到不同的比较元素形式、在c盘上执行写入和管理的影响)
除了重复数据删掉流程细度之外,还有其他诱因也会影响重复数据删掉百分比。例如,生成的数据类型(有些数据本身即更便于复制)、数据变化频度等都影响重复数据删掉百分比。ESG实验室测试过几种重复数据删掉技术pst文件删除邮件后容量没有变小,并觉得不考虑重复数据删掉流程细度,10-20倍的容量削减是现实的。