使用现有的多对多连接更新数据

这是一个策略问题——但我整个星期都在努力解决这个问题，并且真的可以使用一些智慧即服务。

语境

我正在尝试将一个干净、可操作的 PostgreSQL 数据库与来自大量杂乱、嘈杂的原始源表的清理记录拼凑在一起。

假设我们有联系人、公司、商店。许多联系人可以在公司工作。contacts_companies一家商店可能涉及多家公司（所有者、维护人员等）。和之间存在多对多 (M:N) 连接companies_stores。

表关系：

contacts >-< contacts_companies >-< companies >-< companies_stores >-< stores

unique on: contacts:email, companies:name, stores:formatted_address

多个数据源在上述表格之间存在各种重叠。有些只是存储信息，有些有一些联系人和存储信息等。当我浏览每个数据源时，数据将被清理然后更新到适当的表中。

upsert 操作是问题所在。使用 ON CONFLICT 插入对于特定表来说很好，但是之间的连接点呢？

为了说明这个问题，假设我们有一个具有以下记录的数据源：

{owner: "Alice A.", email: "A@Alice_stores.net", store_address:"1 main st"}

这个记录有

数据库可能已经有的商店1 main st，但没有的联系人/公司Alice。

如果我们单独更新联系人、公司和商店，我们将不知道在联结表中放置哪些正确的 ID：

当全面存在 M:N 关系时，从各种来源更新多个表的最佳策略是什么？

我想到的一种策略是查询所有表/联结，将它们保存在内存中并在内存中执行所有条件/更新，然后进行更有力的 upsert。但这很快就会失控......