重复数据删除技术背景知识介绍.pdf
文本预览下载声明
白皮书
重复数据删除技术背景知识介绍:
技术白皮书
声明
本白皮书可能包含受版权保护的专有信息。所含信息如有更改,恕不另行通知。本白皮书不代表
Quantum 方面做出任何承诺。尽管可确定信息来源非常可靠,但对于本白皮书中可能包含的不准确信
息,Quantum 不承担任何责任。Quantum 不保证本白皮书中的信息始终是最新的,而且保留在不另行
通知的情况下,更改或不再发布本白皮书和/或产品的权利。未经 Quantum 明确书面许可,除购买者
之外的其他任何人都不得出于个人使用的目的,以影印、录制或信息存储和检索系统等电子或机械方
式,或以任何形式复制或传播本文档的任何部分。
白皮书
目录
重复数据删除—来自共用存储池的多个数据集3
固定长度数据块与可变长度数据段对比4
重复数据删除存储池数据变化的影响5
共享共用的重复删除数据块池7
重复数据删除架构7
“线内”方法与 “后期处理”方法比较8
将重复数据删除技术用于数据复制8
复制方法背景知识9
应用于复制的重复数据删除技术9
应用于复制的加密技术11
Quantum DXi 系列基于磁盘的备份解决方案相关信息11
特征和优势简介12
表A-1 至表A-6 12
表A-7 至表A-10 13
重复数据删除技术背景知识介绍 2
白皮书
Quantum 公司在本白皮书中使用的术语 “重复数据删除”是指特定的数据简化方法,该方法
基于这样一种原理构建而成:为特定数据集中长度可变的冗余数据块 (数据段)系统替换引用
指针。重复数据删除的目的是增大磁盘阵列中可存储的信息量,并增加可通过网络传输的有效
数据量。如果基于长度可变的数据段进行重复数据删除,则可以提供比单实例存储技术更大的
粒度,因而能够识别并且无需存储所有相同文件的重复实例。事实上,针对可变长度数据块的
重复数据删除技术可以与基于文件的数据简化系统结合使用,以提高效率。此外,它还与用于
压缩写入磁带或磁盘的数据的现有压缩系统兼容,并且能够在解决方案级别实现与压缩功能的
整合。针对长度可变数据块的重复数据删除技术的关键要点最先在公司 1999 年向 Rocksoft,
Ltd (现在成为了Quantum 公司的一部分)发布的专利中进行了说明。
注意:在数据简化领域,术语标准化仍在不断进行。术语 “重复数据删除”也相应地可用
于未使用可变长度数据段的数据简化方法。适用于小型企业办公/家庭办公环境的 Quantum
GoVault ™ 磁盘备份系统采用了不同的重复数据删除技术,该技术可标识不同版本备份文件的
位级变化。有些厂商还可能使用此术语指代主要基于文件的方法或可能使用固定长度数据段的
方法。
在介绍重复数据删除技术之前,多了解一些有关如何在基于磁盘的传统存储系统中表示文件和
数据集的存储知识对读者是有帮助的。单一文件或单一数据集中的数据几乎不会被存储到单一
显示全部