merit Asked: 2021-04-24 17:29:22 +0800 CST2021-04-24 17:29:22 +0800 CST 2021-04-24 17:29:22 +0800 CST 归一化的优缺点 772 简而言之,规范化作为一种数据库设计技术的主要优点和缺点是什么? 用一些无组织数据的快照来回答这个问题可能更容易,作为一个具体的例子: normalization 1 个回答 Voted Best Answer J.D. 2021-04-24T19:14:37+08:002021-04-24T19:14:37+08:00 这是一篇 Microsoft 文章,它很好地解释了规范化和不同的形式,尽管关于 Microsoft Access 有点过时,但理论和原则仍然适用。 简而言之,数据库规范化具有以下好处: 减少数据冗余,从而提高可维护性。正如您在示例表中看到的那样,不必要地重复了对销售不重要Customer_Sale的事情。 列就是一个很好的例子ItemDesc。想象一下过去一年的ItemNo = 123销售情况,例如成千上万的销售额。然后业务意识到这是错误的并且需要更新。使用当前将. _ _ _ _CustomersItemDescItemDescCustomer_SaleItemDesc 规范化将是调用另一个表Items,该表将存储每个唯一的一行,Item并且是该表所在的位置ItemDesc。该表的主键可能是ItemNo(假设这是Item此处的唯一标识符)。ItemNo = 123因此,表中的ItemDesc列将只有一条记录Items。该Customer_Sale表将不再有一个名为的列ItemDesc(您可以Items通过加入ItemNo两个表中的字段来在表中引用它)。现在,如果Item需要更改对 an 的描述,您只需在一个地方更新它,即Items表中的那一行。 出于类似的原因,这将通过最大限度地减少上述维护类型所需的工作量来提高性能。更少的更新行通常意味着更短的锁定时间和更少的锁定升级机会(如果适用)。因此,总体而言,您的数据库系统和使用它的应用程序将能够更有效地运行。 由于规范化,性能可能会提高的另一个原因是因为您的表(以及它们存在于磁盘上的对象 - 通常称为数据页)的数据大小变得更小。 这有助于提高 SQL 引擎在从磁盘定位和加载这些数据页时的性能,这通常是服务器预配置硬件的最大瓶颈。由于您的表及其行的大小变得更小,这意味着单个数据页中可以容纳更多行,这意味着需要定位和从磁盘加载的页面也更少。 从消费应用程序的角度来看,当您的数据库架构被适当地规范化时,您通常也会获得更大的灵活性。 通过将数据点的字段分解为适当的不太宽的表,这对您的域模型具有一般意义,并将特定实体的密切相关字段放在同一个表中,您可以最大限度地利用、查询、并在您的消费应用程序中根据需要操作这些数据点和实体(在非常松散的意义上重构您的数据)。 再次使用您的表的一个示例Customer_Sale是,如果您有一个具有两个屏幕的销售订单应用程序。一个是该Items企业的唯一销售清单及其描述,另一个是Customer_Sales该企业迄今为止制作的清单。 如果您没有存储该字段的规范化 表(如我的第一点所举例说明的那样),那么要同时支持这些屏幕及其用例,由于其数据,您将很难使用不太灵活的非规范化表信息冗余。ItemsItemDesc Customer_SaleItems 当然,在您的消费编程语言中,您可以使用不同类型的运算符来转换您的Customer_Sale表格数据以适应Items可出售屏幕的模型,但这是消费应用程序每次都需要做的一组额外工作该屏幕已加载。管理代码也变得很冒险,特别是随着时间的推移,更复杂的业务规则开始发挥作用,而不是表已经存在的规范化数据库架构。Items 标准化的可能缺点是: 过度标准化会导致潜在的性能问题。通过将字段分解成太多的表,它可能会使查询过于复杂,这总是涉及将这些表中的大多数重新连接在一起以获得您需要的行。一些数据库系统在连接过多的情况下更加困难,但您的里程可能会有所不同。 在旨在支持繁重的OLAP(在线分析处理- 本质上是数据仓库和繁重的报告目的)的数据库结构中,有时通过将缓存和预先计算的常用事实和数据保持在附近,非规范化表的性能会更好。 我在此答案开头链接的文章中未讨论此答案中未讨论的更深入和技术性的推理。因此,我强烈建议您在从该答案中获得非常简短的概述后通读该文章。
这是一篇 Microsoft 文章,它很好地解释了规范化和不同的形式,尽管关于 Microsoft Access 有点过时,但理论和原则仍然适用。
简而言之,数据库规范化具有以下好处:
减少数据冗余,从而提高可维护性。正如您在示例表中看到的那样,不必要地重复了对销售不重要
Customer_Sale
的事情。列就是一个很好的例子
ItemDesc
。想象一下过去一年的ItemNo = 123
销售情况,例如成千上万的销售额。然后业务意识到这是错误的并且需要更新。使用当前将. _ _ _ _Customers
ItemDesc
ItemDesc
Customer_Sale
ItemDesc
规范化将是调用另一个表
Items
,该表将存储每个唯一的一行,Item
并且是该表所在的位置ItemDesc
。该表的主键可能是ItemNo
(假设这是Item
此处的唯一标识符)。ItemNo = 123
因此,表中的ItemDesc
列将只有一条记录Items
。该Customer_Sale
表将不再有一个名为的列ItemDesc
(您可以Items
通过加入ItemNo
两个表中的字段来在表中引用它)。现在,如果Item
需要更改对 an 的描述,您只需在一个地方更新它,即Items
表中的那一行。出于类似的原因,这将通过最大限度地减少上述维护类型所需的工作量来提高性能。更少的更新行通常意味着更短的锁定时间和更少的锁定升级机会(如果适用)。因此,总体而言,您的数据库系统和使用它的应用程序将能够更有效地运行。
由于规范化,性能可能会提高的另一个原因是因为您的表(以及它们存在于磁盘上的对象 - 通常称为数据页)的数据大小变得更小。
这有助于提高 SQL 引擎在从磁盘定位和加载这些数据页时的性能,这通常是服务器预配置硬件的最大瓶颈。由于您的表及其行的大小变得更小,这意味着单个数据页中可以容纳更多行,这意味着需要定位和从磁盘加载的页面也更少。
从消费应用程序的角度来看,当您的数据库架构被适当地规范化时,您通常也会获得更大的灵活性。
通过将数据点的字段分解为适当的不太宽的表,这对您的域模型具有一般意义,并将特定实体的密切相关字段放在同一个表中,您可以最大限度地利用、查询、并在您的消费应用程序中根据需要操作这些数据点和实体(在非常松散的意义上重构您的数据)。
再次使用您的表的一个示例
Customer_Sale
是,如果您有一个具有两个屏幕的销售订单应用程序。一个是该Items
企业的唯一销售清单及其描述,另一个是Customer_Sales
该企业迄今为止制作的清单。如果您没有存储该字段的规范化 表(如我的第一点所举例说明的那样),那么要同时支持这些屏幕及其用例,由于其数据,您将很难使用不太灵活的非规范化表信息冗余。
Items
ItemDesc
Customer_Sale
Items
当然,在您的消费编程语言中,您可以使用不同类型的运算符来转换您的
Customer_Sale
表格数据以适应Items
可出售屏幕的模型,但这是消费应用程序每次都需要做的一组额外工作该屏幕已加载。管理代码也变得很冒险,特别是随着时间的推移,更复杂的业务规则开始发挥作用,而不是表已经存在的规范化数据库架构。Items
标准化的可能缺点是:
过度标准化会导致潜在的性能问题。通过将字段分解成太多的表,它可能会使查询过于复杂,这总是涉及将这些表中的大多数重新连接在一起以获得您需要的行。一些数据库系统在连接过多的情况下更加困难,但您的里程可能会有所不同。
在旨在支持繁重的OLAP(在线分析处理- 本质上是数据仓库和繁重的报告目的)的数据库结构中,有时通过将缓存和预先计算的常用事实和数据保持在附近,非规范化表的性能会更好。
我在此答案开头链接的文章中未讨论此答案中未讨论的更深入和技术性的推理。因此,我强烈建议您在从该答案中获得非常简短的概述后通读该文章。