使用 UUID 或 GUID 作为主键有什么缺点？

Question

luisepa1420

Asked: 2020-12-10 19:06:48 +0800 CST2020-12-10 19:06:48 +0800 CST 2020-12-10 19:06:48 +0800 CST

简单主键与复合主键的优缺点

772

我正在尝试为数据库建模。对于问题的一部分，我有一个实体区域，其中包含部门，并且每个部门都分配了特定的功能。我有以下。

我想了两种处理关系的方法。第一种是为 Department 表创建一个自增键，假设部门名称可以在不同区域重复。我对 Function 表执行相同操作，将可递增键作为标识符，并为组合（Department_ID、Name）创建一个唯一键。

第二种方式是把字段组合（Department_ID, Name）作为Department的主复合键，Function表也一样，把字段（Department_ID, Name）作为复合主键。

与第一种情况一样，使用简单键而不是复合键有哪些优点或缺点，它如何影响唯一键的使用？这是正确的方法吗？

3 个回答

Voted

bbaird · Answer 1 · 2020-12-11T08:01:18+08:00

简短的回答

从逻辑的角度来看，复合键没有固有的缺点。它存在。如果需要保持唯一性/数据完整性，则必须使用它。

从物理实现的角度来看，复合键可能会创建 b 树和聚集索引（如果使用/支持）的碎片，因为不保证插入会附加到表的末尾。大多数商业数据库引擎都非常擅长处理/管理碎片（有些总是将新行附加到新页面），所以这不应该是您选择一个而不是另一个的理由，除非在非常有限的情况下。

更长的答案

所以让我们回顾一下，因为我认为大多数从业者都忽略了关于主键的一个关键问题：

主键必须强制数据的唯一性。

id列不强制唯一性，因为它是系统生成的，而不是从数据中生成的。

因此，在数据建模开始时对每个实体都添加一个是没有意义的，id因为它会妨碍您理解数据的实际结构。id一旦知道实际的键，我们就可以稍后应用列。将id成为先前主键的代理项，该键将成为备用键。

因此，我可以从您的图表中看到，您至少知道后来的事实Function，但没有将其应用于Areaor Department。

因此，让我们首先从等式中删除行标识符。这就是你所拥有的：

这时候自然会问：

是function独立于一切的departments吗？
一个以上可以department实现相同function吗？

在第一种情况下，我们的模型将变为：

但如果第二个成立，那么模型将是：

所以你可以看到，在我们开始考虑是否用代理项替换现有的主键之前，还有很多工作要做。

我们可能会认为Area_Name它太宽而无法在实践中使用。我们可以将其作为备用键并替换为人类可读的代码/短名称（首选）或系统生成的整数（如果您确实必须）。我们可以类似地决定Department_Name.

所以让我们实现第二个模型，用代理替换宽键：

在这种情况下，DepartmentFunction键(Department_Id,Function_Id)是：

袖珍的
保留与的关系Department，稍后在数据模型中可能需要该关系以实现完整性

所以没有令人信服的理由来取代它。

我要强调的一件事是，仅使用整数代理作为最后的手段。如果有可以使用的速记/代码，则最好是：

它是人类可读的
可能已经普遍使用
可能会减少所需的连接数
如果长度小于 4 可能会更紧凑
减少数据错误（整数列被交换的次数超过了一些人愿意承认的次数）

Akina · Answer 2 · 2020-12-10T21:50:51+08:00

Akina

2020-12-10T21:50:51+08:002020-12-10T21:50:51+08:00

第二种方式是将字段组合（Department_ID，Name）作为Department的主复合键

这是错误的，因为：

既不提供Department_ID也不提供Name唯一性
增加连接表达式的复杂性和大小（在两个表中！）并因此降低连接性能而没有任何可见的利润

与复合键相比，使用简单键有哪些优点或缺点

我们现在只谈论主键，是吗？

复合主键始终必须是自然的。即使它是 2 列的组合，这些列是对另一个表的合成 PK 的引用（M:N 关系连接表）。包含合成组件的复合主键没有意义 - 表上的行唯一性可能仅由此合成表达式控制。当需要某些自然表达式的唯一性时，常规唯一索引就足够了。

1

J.D. · Answer 3 · 2020-12-10T19:59:15+08:00

J.D.

2020-12-10T19:59:15+08:002020-12-10T19:59:15+08:00

你可以而且通常两者兼有是个好主意。一个简单的自增键保证了唯一性，并且通常是最适合加入的，但是复合键有助于揭示实体的逻辑目的及其关系（只要它是自然的而不是强制的）。

至于选择一个作为实际的 PrimaryKey 约束，如果您的表最终同时具有自然复合键和唯一的自动增量字段，您可以将复合键设置为 PrimaryKey 约束，但单独将自动增量字段设置为唯一聚集索引。您还可以在 PrimaryKey 上创建非聚集索引。（从技术上讲，您还可以将复合键设置为聚集索引，并在自动增量字段上执行唯一的非聚集索引。）这样您就可以在任一键上进行高性能连接。

0

简单主键与复合主键的优缺点

简短的回答

更长的答案

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

简单主键与复合主键的优缺点

3 个回答

简短的回答

更长的答案

相关问题