此故障转移到 Logshipped 辅助和再次故障恢复过程是否正确？

Question

Anmol Singh Jaggi

Asked: 2024-10-02 13:25:20 +0800 CST2024-10-02 13:25:20 +0800 CST 2024-10-02 13:25:20 +0800 CST

在将检查点条目附加到预写日志之前，数据库崩溃

例如，考虑以下情况：

我们有一张虚拟表Person(name, age, salary)。
它有一个条目John, 25, 100。
在时间T1，一个新的交易到达UPDATE Person SET salary += 100 WHERE name='John'。
假设在 T1 之前，所有数据都已被刷新并且检查点条目已附加到 WAL。
现在，在此事务之后，数据库将首先在日志中附加精确的事务语句UPDATE Person SET salary += 100 WHERE name='John'。
现在数据变成了John, 25, 200。
然后过了一段时间，假设数据库决定在时间 T2 将数据刷新到磁盘。
然后在时间 T3（紧接着 T2）时，DB 尝试将检查点条目写入 WAL。
然而，航班尚未完成，T2和T3之间就发生了电源故障。
现在，当数据库重新启动并尝试恢复时，它会注意到最新检查点之后有一个事务，并将尝试执行该事务：UPDATE Person SET salary += 100 WHERE name='John'
但由于该交易在崩溃之前已经执行，这次工资将取值为 300，尽管它应该是 200。

数据库如何在恢复期间防止这些冗余更新？

Charlieface · Answer 1 · 2024-10-02T19:38:44+08:00

Best Answer

Charlieface

此次事务之后，DB会先将准确的事务语句追加到日志中UPDATE Person SET salary += 100 WHERE name='John'。

你似乎在这儿有一个误解。

WAL不包含UPDATE Person SET salary += 100 WHERE name='John'，因此它不会再次“运行”并得到错误的结果。

它只包含该语句修改的任何行/页面的新版本。因此，检查点所需要做的就是将所有这些页面写入主文件。它可以随时再次执行此操作，因为它是幂等的，因此恢复时第二次前滚不会影响任何内容。