pelo meu entendimento, usar discos de 20-30 TB com HDFS pode apresentar alguns desafios, mas também pode ser gerenciado de forma eficaz com a configuração adequada
usar discos de 20-30 TB com HDFS é possível, mas requer consideração cuidadosa do tamanho do bloco, tempos de reconstrução, distribuição de dados, gerenciamento de metadados e desempenho. Planejamento e configuração adequados podem ajudar a mitigar esses desafios.
Desempenho: discos grandes podem levar a tempos de busca mais longos e potencialmente impactar o desempenho, especialmente para cargas de trabalho que exigem acesso aleatório frequente.
com base no exposto acima, podemos pretender usar discos de 20T-30T em nossas novas máquinas de nós de dados ?
Observe que pretendemos instalar do zero 16 máquinas de nós de dados baseadas no hardware DELL, quando cada nó de dados deve conter 12 discos NÃO RAID ( quando cada tamanho de disco for ~22T )