在大学的最后一堂课中(我是学生),讲师要求我们开发一个数据库(如果重要,可以使用 MySQL 服务器)和将数据库用作数据源的微型客户端应用程序。
要求之一是标识列(即每个表中的 PK)必须是连续的,因为这是一种很好的做法(根据讲师的话)。即当删除表行时,它的 PK 必须在后续插入中重复使用。我在 RDBMS、PK 和身份列方面具有平均知识。据我了解,该标识列只是让数据库在插入行时自动生成 PK 的一种方式,仅此而已。并且标识列值不应以任何方式与行属性相关(只要它不是自然键)。
这个要求(严格的顺序标识列)对我来说很可疑。我试图问讲师,如果身份不是顺序的(由于删除导致的间隙),有什么问题,但得到了非常抽象的答案,例如“这对用户来说很方便,对维护数据库的数据库管理员很有用”。没有具体的例子。“方便用户”的说法听起来很愚蠢,因为它在业务领域没有任何意义。
因此,我很好奇这些原因是否真实?我只能想到一种需要重新设置标识列的情况——当标识空间耗尽时。但是,当标识列类型选择不正确时,这是更多的设计问题,比如简单int
而不是bigint
表uniqueidentifier
包含十亿行时。假设一个标识列是一个聚集索引:标识列中的间隙会影响索引性能吗?也许在我不知道的每次删除后自动标识列重新播种的其他现实原因?
提前致谢!