Testei o Amazon Redshift como um cache. Então eu salvo dados por uma chave. Mas com o tempo o cache fica cada vez mais lento. Depois de fazer um VACCUM no banco de dados, ele volta à velocidade. Mas devo executar o VACCUM continuamente no banco de dados? Ou existe uma maneira melhor de usar tabelas redshift para leituras, gravações e exclusões contínuas.
Eu não recomendaria usar redshift como cache. Já pensou no Redis?
O Redshift salva todos os dados no disco em blocos de 1 MB, em uma ordem estabelecida por sua chave de classificação e distribuída entre os nós com base em sua chave dist. Sempre que você cria, atualiza, exclui, você está anexando dados aos últimos blocos do banco de dados. Esses blocos que contêm todas as novas alterações não são classificados até que você limpe o banco de dados.
Portanto, quando você usa o redshift como cache, está fragmentando seus dados muito rapidamente, tornando suas consultas lentas.
Certamente um GRANDE NÃO para usar redshift como cache.
A menos que, por cache, você queira dizer armazenar agregados pré-computados.