Estamos redesenhando o servidor de arquivos ZFS atual. Atualmente, possui apenas um pool de mais de 70 TB.
Vejo que isso é um problema, pois, se houver falhas de disco suficientes no pool para torná-lo não funcional, teremos que restaurar todos os 60 TB de dados existentes no momento.
Surgiu um debate sobre como dividir o armazenamento em pools menores e quão grande/pequeno cada um desses pools deve ser.
A meu ver, a única desvantagem de usar pools "muito pequenos" é muito espaço em disco desperdiçado. Estamos usando 4TB 7500 spinning disks
com 4TB SSD cache disks
. Então, estou inclinado para vdisks raidz de 20 TB. Isso significa que obtemos cerca de 77% do espaço em disco utilizável.
P: Existem outras vantagens/desvantagens em tornar as piscinas muito grandes/muito pequenas?
Uma vantagem distinta e significativa de um único pool ZFS grande é que a alocação de espaço é muito mais flexível em um único pool grande.
Se, por exemplo, você tiver três conjuntos separados de dados e 60 TB de espaço em disco (ignorando perdas de RAID), se você criar um pool ZFS, o total de dados armazenados em todos os três conjuntos de dados será limitado a 60 TB e poderá ser dividido de qualquer maneira entre os três conjuntos de dados. (Suponho que você criaria conjuntos de dados ZFS separados em um grande pool ZFS - um para cada conjunto de dados.)
Mas se você dividir o armazenamento em três pools de 20 TB e colocar um conjunto de dados em cada pool, o total ainda será limitado a 60 TB, mas você também limitou cada conjunto de dados a 20 TB.
Isso é uma grande perda de flexibilidade. Se você não prever adequadamente o crescimento de dados, terá discos desperdiçados nos pools que não cresceram tanto quanto você pensou que cresceriam e terá que comprar discos extras para o pool que cresceu. Ou remova os discos de um pool e mova-os para outro por meio de um backup, destruição e restauração que provavelmente serão desagradáveis.
Em segundo lugar, você tem certeza de que seu pool dividido é realmente mais confiável do que um único pool grande? Outra vantagem de um pool grande: todos os discos hot spare estão disponíveis para substituir qualquer disco com falha no pool (supondo que todos os discos sejam idênticos). Se você usar vários pools, os hot spares no pool A não poderão ajudar os zdevs no pool B a sobreviver a uma falha de disco. Três pools, cada um com dois hot spares, podem muito bem ser menos confiáveis do que um único pool com acesso a seis hot spares.