Minha função new_customer
é chamada várias vezes por segundo (mas apenas uma vez por sessão) por um aplicativo da web. A primeira coisa que ele faz é bloquear a customer
tabela (para fazer uma 'inserção se não existir' - uma variante simples de um upsert
).
Meu entendimento dos documentos é que outras chamadas new_customer
devem simplesmente ficar na fila até que todas as chamadas anteriores sejam concluídas:
LOCK TABLE obtém um bloqueio em nível de tabela, aguardando, se necessário, a liberação de quaisquer bloqueios conflitantes.
Por que às vezes é um impasse em vez disso?
definição:
create function new_customer(secret bytea) returns integer language sql
security definer set search_path = postgres,pg_temp as $$
lock customer in exclusive mode;
--
with w as ( insert into customer(customer_secret,customer_read_secret)
select secret,decode(md5(encode(secret, 'hex')),'hex')
where not exists(select * from customer where customer_secret=secret)
returning customer_id )
insert into collection(customer_id) select customer_id from w;
--
select customer_id from customer where customer_secret=secret;
$$;
erro do registro:
2015-07-28 08:02:58 BST DETALHE: Processo 12380 aguarda ExclusiveLock na relação 16438 da base de dados 12141; bloqueado pelo processo 12379. Processo 12379 aguarda ExclusiveLock na relação 16438 do banco de dados 12141; bloqueado pelo processo 12380. Processo 12380: selecione new_customer(decode($1::text, 'hex')) Processo 12379: selecione new_customer(decode($1::text, 'hex')) 2015-07-28 08:02:58 BST DICA: Consulte o log do servidor para obter detalhes da consulta. 2015-07-28 08:02:58 BST CONTEXT: Função SQL "new_customer" instrução 1 28/07/2015 08:02:58 DECLARAÇÃO BST: selecione new_customer(decode($1::text, 'hex'))
relação:
postgres=# select relname from pg_class where oid=16438;
┌──────────┐
│ relname │
├──────────┤
│ customer │
└──────────┘
editar:
Consegui obter um caso de teste reproduzível simples. Para mim, isso parece um bug devido a algum tipo de condição de corrida.
esquema:
create table test( id serial primary key, val text );
create function f_test(v text) returns integer language sql security definer set search_path = postgres,pg_temp as $$
lock test in exclusive mode;
insert into test(val) select v where not exists(select * from test where val=v);
select id from test where val=v;
$$;
script bash executado simultaneamente em duas sessões bash:
for i in {1..1000}; do psql postgres postgres -c "select f_test('blah')"; done
log de erros (geralmente um punhado de impasses nas 1000 chamadas):
2015-07-28 16:46:19 BST ERROR: deadlock detected
2015-07-28 16:46:19 BST DETAIL: Process 9394 waits for ExclusiveLock on relation 65605 of database 12141; blocked by process 9393.
Process 9393 waits for ExclusiveLock on relation 65605 of database 12141; blocked by process 9394.
Process 9394: select f_test('blah')
Process 9393: select f_test('blah')
2015-07-28 16:46:19 BST HINT: See server log for query details.
2015-07-28 16:46:19 BST CONTEXT: SQL function "f_test" statement 1
2015-07-28 16:46:19 BST STATEMENT: select f_test('blah')
edição 2:
@ypercube sugeriu uma variante com o lado de lock table
fora da função:
for i in {1..1000}; do psql postgres postgres -c "begin; lock test in exclusive mode; select f_test('blah'); end"; done
curiosamente, isso elimina os impasses.
Eu postei isso no pgsql-bugs e a resposta lá de Tom Lane indica que este é um problema de escalonamento de bloqueio, disfarçado pela mecânica da maneira como as funções da linguagem SQL são processadas. Essencialmente, o bloqueio gerado pelo
insert
é obtido antes do bloqueio exclusivo na tabela :Isso também explica por que bloquear a tabela fora da função em um bloco plpgsql de empacotamento (conforme sugerido por @ypercube) evita os bloqueios.
Supondo que você execute outras instruções antes de chamar new_customer, e essas adquiram um bloqueio conflitante
EXCLUSIVE
(basicamente, qualquer modificação de dados na tabela customer), a explicação é muito simples.Pode-se reproduzir o problema com um exemplo simples (sem incluir uma função):
1ª sessão:
2ª sessão
1ª sessão
Quando a primeira sessão faz a inserção, ela adquire o
ROW EXCLUSIVE
bloqueio em uma tabela. Enquanto isso, as tentativas da sessão 2 também obtêm oROW EXCLUSIVE
bloqueio e tentam adquirir umEXCLUSIVE
bloqueio. Nesse ponto, ele deve aguardar a 1ª sessão, pois oEXCLUSIVE
bloqueio entra em conflito comROW EXCLUSIVE
. Por fim, a 1ª sessão pula os tubarões e tenta conseguir umaEXCLUSIVE
fechadura, mas como as fechaduras são adquiridas em ordem, entra na fila após a 2ª sessão. Este, por sua vez, aguarda o 1º, produzindo um impasse:A solução para esse problema é adquirir os bloqueios o mais cedo possível, geralmente como a primeira coisa em uma transação. Por outro lado, a carga de trabalho do PostgreSQL só precisa de bloqueios em alguns casos muito raros, então sugiro repensar a maneira como você faz o upsert (dê uma olhada neste artigo http://www.depesz.com/2012/06/10 /porque-é-insert-tão-complicado/ ).