在我管理的台球联赛中,我正在从使用 Excel 电子表格转换为使用 MySQL 数据库的应用程序。
我了解消除/最小化冗余以避免数据损坏。因此,在我有 3 列 Bonus1、Bonus2 和 BonusT 的电子表格中,其中 BonusT=Bonus1+Bonus2,在表中我将只有 Bonus1 和 Bonus2,如果我想使用 BonusT,我只是即时计算。
但是假设计算字段的计算难度要大得多,涉及许多其他记录的数据。例如,我想跟踪一名球员在联赛中的出场次数,因为我会在每场比赛后计算让分盘的变化,并根据他参加的比赛次数进行不同的计算。
我可以为他的游戏数量向 user_meta 表(这是 WordPress)添加一条记录,并在添加新匹配时增加它。或者,我可以做某种嵌套查询来每次都获取此信息。
我只是想知道在“欺骗”正常形式被证明并变得合适之前,子查询(或我不熟悉的其他方法)必须变得多么复杂?
我建议您使用规范化数据模型并使用JOINS。在实际应用中,有时不需要下钻到原子级别,可以根据需要停止级别聚合。另外,如果历史数据对你很重要,你可以考虑历史表而不是更新元数据信息。为此,您可以参考Slowly Changing Dimensions (SCD)。
如果计算涉及复杂性,了解各个实体之间的关系并将它们捕获在表中。这可以通过创建存储过程或函数来实现。
我希望这个答案能帮助您入门。谢谢你。
原则上,我会说在规范化方面你应该避免“作弊”。专注于 1NF、2NF、3NF——这些可能就是您所需要的。
我认为 - 对于初学者 - 实现 2NF 的步骤是最难理解的。然而,如果你做对了,你将从你的查询中消除很多复杂性。
示例可在此处找到: https ://www.ibm.com/support/knowledgecenter/en/SSGU8G_12.1.0/com.ibm.ddi.doc/ids_ddi_186.htm
另一个例子,可能对你来说更重要——在你问题的第三段,你描述了一个特定的问题,即跟踪一个球员在联赛中的比赛次数。如果每个 GAME 都有一个或多个 PLAYERS,并且每个玩家可以玩一个或多个游戏,那么您需要建模(和编码)一个交叉实体/表。那里的 COUNT() 条目将为您提供玩家玩的游戏数量(非常容易)。
此外,了解如何使用 VIEWS 也是一个好主意。使用它们时,您可以照原样创建虚拟表。视图将允许您从中选择,它们也可以组合(与其他视图和查询)。
关于你最后一段中的问题:考虑到你是数据库设计的新手,这可能是“反过来”:如果你的(子)查询变得太复杂,你已经“作弊”了,需要修改模型.
如果您正在使用 MySQL,则可以使用 MySQL Workbench 进行建模。该软件还允许您进行“逆向工程”,即从 DDL 代码(用于描述数据库结构的 SQL CREATE 和 ALTER 语句)创建模型。
那么,当您获得 Bonus 3 时,您打算做什么?
因此将只有一个 Bonus 列。同样,你在每一步都不断地问这样的问题。
是的,不需要 bonsu 3,因为计算很容易,您可以即时对 bonsu 列求和。
是的,如果计算很复杂,那么您可以将计算出的值存储在列中。但这取决于例子。