Tenho uma dúvida relacionada ao desempenho. Digamos que eu tenha um usuário com o primeiro nome Michael. Faça a seguinte consulta:
UPDATE users
SET first_name = 'Michael'
WHERE users.id = 123
A consulta realmente executará a atualização, mesmo que esteja sendo atualizada para o mesmo valor? Se sim, como faço para evitar que isso aconteça?
Devido ao modelo MVCC do Postgres, e de acordo com as regras do SQL, um
UPDATE
escreve uma nova versão de linha para cada linha que não é excluída naWHERE
cláusula.Isso tem um impacto mais ou menos substancial no desempenho, direta e indiretamente. "Atualizações vazias" têm o mesmo custo por linha que qualquer outra atualização. Eles disparam gatilhos (se presentes) como qualquer outra atualização, eles precisam ser registrados no WAL e produzem linhas mortas que incham a tabela e causam mais trabalho para
VACUUM
mais tarde, como qualquer outra atualização.Entradas de índice e colunas TOASTed em que nenhuma das colunas envolvidas é alterada podem permanecer as mesmas, mas isso é verdade para qualquer linha atualizada. Relacionado:
É quase sempre uma boa ideia excluir essas atualizações vazias (quando há uma chance real de que isso aconteça). Você não forneceu uma definição de tabela em sua pergunta. Temos que assumir que
first_name
pode ser NULL (o que não seria surpreendente para um "primeiro nome"), portanto, a consulta deve usar comparação segura de NULL :Se
first_name IS NULL
antes da atualização, um teste com justfirst_name <> 'Michael'
seria avaliado como NULL e, como tal, excluiria a linha da atualização. Erro sorrateiro. Se a coluna for definidaNOT NULL
, use a verificação de igualdade simples, porém, isso é um pouco mais barato.Relacionado:
ORM's como Ruby on Rail oferecem execução adiada que marca um registro como alterado (ou não) e, quando necessário ou chamado, envia a alteração para o banco de dados.
PostgreSQL é um banco de dados e não um ORM. Teria diminuído o desempenho se demorasse para verificar se um novo valor era igual ao valor atualizado em sua consulta.
Portanto, ele atualizará o valor independentemente de ser o mesmo que o novo valor ou não.
Se você deseja evitar isso, pode usar código como Max Vernon sugeriu em sua resposta.
Você poderia simplesmente adicionar à
where
cláusula:Se
first_name
for definido comoNOT NULL
, aOR first_name IS NULL
peça pode ser removida.A condição:
também pode ser escrito de forma mais elegante como (na resposta de Erwin):
Do ponto de vista do banco de dados
A resposta para sua pergunta é sim. A atualização ocorrerá. O banco de dados não verifica o valor anterior, apenas define o novo valor.
Como isso acontece na memória (e só será gravado nos arquivos de dados após a emissão de um commit), o desempenho não seria um problema.
Do ponto de vista do ORM
Normalmente você terá um Object representando uma única linha do banco de dados (pode ser muito mais complexo do que isso, mas vamos simplificar). Esse objeto é gerenciado na memória (no nível do servidor de aplicativos) e somente a versão confirmada mais recente desse objeto chegará ao banco de dados em um determinado ponto.
Isso pode explicar o comportamento diferente.
Agora, não vamos comparar um navio de carga com uma impressora 3D. O fato de você poder enviar impressoras 3D usando navios cargueiros não significa que possa haver qualquer tipo de comparação entre elas.
Apreciar!
Espero ter esclarecido alguns conceitos.