Estou experimentando a desduplicação em um espaço de armazenamento do Server 2012 R2. Deixei executar a primeira otimização de desduplicação ontem à noite e fiquei satisfeito ao ver que reivindicou uma redução de 340 GB.
No entanto, eu sabia que isso era bom demais para ser verdade. Nessa unidade, 100% da desduplicação veio de backups do SQL Server:
Isso parece irreal, considerando que existem backups de bancos de dados com 20x esse tamanho na pasta. Como um exemplo:
Ele considera que um arquivo de backup de 13,3 GB foi reduzido para 0 bytes. E, claro, esse arquivo realmente não funciona quando fiz uma restauração de teste dele.
Para adicionar insulto à lesão, há outra pasta naquela unidade que contém quase um TB de dados que deveria ter deduplicado muito, mas não foi.
A desduplicação do Server 2012 R2 funciona?
A desduplicação funciona.
Com a desduplicação, o campo Tamanho no disco se torna sem sentido. Os arquivos não são mais "arquivos" usuais, mas pontos de nova análise e não contêm dados reais, mas metadados para o mecanismo de desduplicação para reconstruir o arquivo. Pelo que entendi, você não pode obter economias por arquivo, pois o armazenamento de fragmentos de desduplicação é por volume, portanto, você obtém apenas economias por volume. http://msdn.microsoft.com/en-us/library/hh769303(v=vs.85).aspx
Talvez seu trabalho de desduplicação ainda não tenha sido concluído, caso alguns outros dados ainda não tenham sido desduplicados. Não é super rápido, tem tempo limitado por padrão e pode ter recursos limitados dependendo do seu hardware. Verifique a programação de desduplicação no Gerenciador do Servidor.
Eu implantei a desduplicação em vários sistemas (Windows 2012 R2) em diferentes cenários (SCCM DP, diferentes sistemas de implantação, servidores de arquivos genéricos, servidores de arquivos de pasta inicial do usuário, etc.) por cerca de um ano. Apenas certifique-se de que você está totalmente corrigido, lembro-me de vários patches para desduplicar a funcionalidade (atualizações cumulativas e hotfixes) desde o RTM.
No entanto, existem alguns problemas que alguns sistemas não podem ler dados diretamente de arquivos otimizados no sistema local (IIS, SCCM em alguns cenários). Conforme sugerido por yagmoth555, você deve tentar Expand-DedupFile para não otimizá-lo ou apenas fazer uma cópia do arquivo (o arquivo de destino não será otimizado até a próxima execução de otimização) e tentar novamente. http://blogs.technet.com/b/configmgrteam/archive/2014/02/18/configuration-manager-distribution-points-and-windows-server-2012-data-deduplication.aspx https://kickthatcomputer.wordpress .com/2013/12/22/no-input-file-specified-windows-server-2012-dedupe-on-iis-with-php/
Se o backup do SQL estiver realmente corrompido, acredito que seja por causa de um problema diferente e não relacionado à tecnologia de desduplicação.
Parece que posso ter me precipitado dizendo que esse tipo de desduplicação não é possível. Aparentemente, é totalmente possível, porque além desses backups descompactados do SQL Server, também tenho backups em nível de instantâneo VMWare das VMs do host.
Como yagmoth555 sugeriu, executei um
Expand-DedupeFile
em alguns desses arquivos de 0 byte e obtive um arquivo totalmente utilizável no final dele.Em seguida, examinei minha metodologia de teste para saber como determinei que os arquivos não eram bons e encontrei uma falha em meus testes (permissões!).
Também abri um arquivo de backup desduplicado de 0 byte em um editor hexadecimal e tudo parecia OK.
Então ajustei minha metodologia de teste e tudo realmente parece funcionar. Ao deixá-lo, os desduplicadores realmente melhoraram e agora economizei mais de 1,5 TB de espaço graças ao dedupe.
Vou testar isso mais detalhadamente antes de colocá-lo em produção, mas agora parece promissor.
Sim, mas eu só vi o caso de um cluster hyperv db deduplicado. 4 TB a 400 g e a VM estava em execução. O sistema operacional foi totalmente corrigido.
Para o seu arquivo de backup sql, é um despejo que você pode ler nele? Eu verificaria o conteúdo. Por essa parte, não posso responder como dedup o arquivo ascii.