Estamos vendo um desempenho lento ao usar o COPY
comando em uma tabela intercalada com 4 chaves de classificação. Quando removo a opção intercalada, a cópia termina muito rapidamente.
Estas são as estatísticas para copiar dados do S3 para o Redshift:
Carregamos 70 milhões de registros
Chave de classificação intercalada - 52 minutos Chave de classificação composta - 8 minutos Sem chave de classificação - 7 minutos
Nossa chave de classificação tinha 4 colunas. Temos um DIST KEY
também.
Alguém pode fornecer um raciocínio de por que o desempenho da cópia em uma chave de classificação intercalada tem um desempenho ruim?