我有一个应用程序语言的 http-server,大致如下所示:
item = SELECT item FROM table WHERE field = 'value'
if (item) {
UPDATE another field on item
} else {
INSERT item VALUE field = 'value' and so on
}
该字段具有唯一约束。大约每隔几分钟就会有两个相同的请求同时value
进入。他们都执行相同的代码,所以当然存在竞争条件。我决定如果我将它包装在具有 SERIALIZABLE 隔离级别的事务中并在每次序列化失败时重试,那么问题就解决了。在本地主机上它工作得很好。我确实看到了如预期的错误代码 40001 引发的序列化失败。
但是,由于某种原因,在负载下的数据库中的生产中Unique constraint violation
偶尔会抛出代码 23505。它只是有时发生。我付出了很多努力在 localhost 上重现它,但失败了。每次我得到一个正常的 40001。我尝试在不同的进程中运行服务器代码,并在不同的点放置延迟以强制执行某些执行顺序。它只发生在生产中。所以我在 prod 中添加了广泛的日志记录。日志说,每次出现问题时,一item
开始都没有发现,但当 INSERT 发生时,它就会触发Unique constraint violation
。所以它看起来只是一个竞争条件。
但是为什么有时在某些情况下 Postgres SERIALIZABLE 事务没有按应有的方式检测到它呢?或者如何调试?在几十个案例中,它一天会发生好几次。
(几乎)准确的 SQL 如下所示:(我省略了详细的字段列表和准确的参数)
START TRANSACTION
SET TRANSACTION ISOLATION LEVEL SERIALIZABLE
SELECT *
FROM products
WHERE product_code = $1
LIMIT 1 -- product_code is a parameter
SELECT *
FROM licenses
WHERE license_key = $1
LIMIT 1 -- license_key is another and it's unique across the table
-- At this point SELECT did not return anything but it was inserted before this INSERT by exactly the same transaction
INSERT INTO licenses ("license_key", "product_id", "other_data",...)
VALUES ($1, $2, $3,...) RETURNING "id"
query failed: error: duplicate key value violates unique constraint "licenses_license_key_key"