lavinio Asked: 2010-03-10 19:08:46 +0800 CST2010-03-10 19:08:46 +0800 CST 2010-03-10 19:08:46 +0800 CST 什么是“重复数据删除”? 772 我的意思是,我可以查字典的定义,但是为什么大家突然提到虚拟磁带库?这里有什么“新”,以至于最近在新闻中如此之多? storage-area-network tape deduplication 2 个回答 Voted Best Answer icky3000 2010-03-10T19:18:30+08:002010-03-10T19:18:30+08:00 重复数据删除是您查看数据集的内容,注意所有存在的重复位,并仅存储一次数据,用指向一个副本的指针替换所有其他数据副本。它对备份特别有用,因为当您备份服务器之类的东西时,很多数据都是相同的。例如,想象一下,您正在备份 1,000 台 Windows 服务器——这些机器上的大部分内容都是相同的。 重复数据删除如今如此流行,原因有 3 个: 最近,每个人都痴迷于构建利用异地服务器的灾难恢复解决方案。为此,您必须将大量生产数据复制到远程站点,并且带宽是一个大问题。您必须复制的数据量的任何减少都会有很大帮助。 公司保留的数据量正在爆炸式增长——这要归功于更便宜的存储和多行业对保留记录的要求。 该技术最近才达到了最佳状态。我们已经有很长时间的重复数据删除(单实例存储等),这有所帮助,但直到去年左右,我们才看到真正的重复数据删除可以显着减少存储量成为主流。 Webs 2010-03-11T05:55:23+08:002010-03-11T05:55:23+08:00 我们在我的公司与 Netapp 合作时发现的一件事是,如果您的驱动器对齐,重复数据删除确实只能在 VM 环境中运行良好。这对我们来说是个问题,因为我们有很多 Windows Server 2003 机器并且没有一个驱动器是对齐的。这意味着如果驱动器正确对齐,您几乎无法恢复大约四分之一的空间。 我们被告知,一旦驱动器正确对齐,我们应该能够通过重复数据删除恢复 40-60% 的空间。
重复数据删除是您查看数据集的内容,注意所有存在的重复位,并仅存储一次数据,用指向一个副本的指针替换所有其他数据副本。它对备份特别有用,因为当您备份服务器之类的东西时,很多数据都是相同的。例如,想象一下,您正在备份 1,000 台 Windows 服务器——这些机器上的大部分内容都是相同的。
重复数据删除如今如此流行,原因有 3 个:
最近,每个人都痴迷于构建利用异地服务器的灾难恢复解决方案。为此,您必须将大量生产数据复制到远程站点,并且带宽是一个大问题。您必须复制的数据量的任何减少都会有很大帮助。
公司保留的数据量正在爆炸式增长——这要归功于更便宜的存储和多行业对保留记录的要求。
该技术最近才达到了最佳状态。我们已经有很长时间的重复数据删除(单实例存储等),这有所帮助,但直到去年左右,我们才看到真正的重复数据删除可以显着减少存储量成为主流。
我们在我的公司与 Netapp 合作时发现的一件事是,如果您的驱动器对齐,重复数据删除确实只能在 VM 环境中运行良好。这对我们来说是个问题,因为我们有很多 Windows Server 2003 机器并且没有一个驱动器是对齐的。这意味着如果驱动器正确对齐,您几乎无法恢复大约四分之一的空间。
我们被告知,一旦驱动器正确对齐,我们应该能够通过重复数据删除恢复 40-60% 的空间。