假设我们有一个关系 R(A, B, C) 与 FD A -> B。假设,对于 R 中的两个元组 t 和 u,如果 t[C] 和 u[C] 都满足布尔条件 -假设小于常数 C - 则 t[B] = u[B]。这是否构成函数依赖?
从更实际的意义上来说,如何规范化这种关系并消除 R(A, B, C) 中的明显冗余并允许无损连接?
假设我们有一个关系 R(A, B, C) 与 FD A -> B。假设,对于 R 中的两个元组 t 和 u,如果 t[C] 和 u[C] 都满足布尔条件 -假设小于常数 C - 则 t[B] = u[B]。这是否构成函数依赖?
从更实际的意义上来说,如何规范化这种关系并消除 R(A, B, C) 中的明显冗余并允许无损连接?
我有一张桌子,我应该弄清楚为什么它会因 1NF、2NF 和/或 3NF 而中断。我知道这三者之间的区别,但我不擅长分辨哪些属性是主键,哪些依赖于什么。有人可以用婴儿的话解释一下吗?我是整个数据库领域的新手。
这是表格:
Auditorium (title of the table)
ACodeID NrSeats Projector PC Uni UniAdr UniPhone
每个属性的说明:
ACodeID
= 每个礼堂的唯一代码。
NrSeats
= 礼堂的座位数。
Projector
= 礼堂是否有投影仪。
PC
= 礼堂是否有电脑。
Uni
= 礼堂位于哪所大学。
UniAdr
= 大学地址。
UniPhone
= 大学的电话号码(本例中每所大学只有一个电话号码)。
另外,关于如何将这个表分成单独的表以便新表满足 3NF 的任何想法?
谢谢!
这是教科书上的问题
Consider the Relation R={A, B, C, D, E, F, G, H } and the set of functional dependencies.
A→C B→CG AD→EH C→DF A→H
What is the key for R? Decompose R into 2NF, 3NF and finally in BCNF relation
我相信A B
是候选键。
我已经像这样将 R 分解为 2nf:
R1={A,C,H,D,F,E,H}
R2={B,C,G,D,G,F}
R3={A,B}
对于 3nf:
R1A={A,C,H}
R1B={C,D,F}
R2={B,C,G}
R3={A,B}
R4={A,D,E}
我的问题
这显然看起来不正确,因为我们仍然有多个异常并且与转换为 bcnf 没有关系。我应该如何正确标准化 R
我正在与使用 OAuth 的服务集成,我需要保存到数据库的数据非常相似。但是,与前两种实现方式略有不同。
它们都有一个令牌、过期时间、refreshToken 和 refreshTokenExpiration。但是,一个有一个“realmId”,另一个有一个需要保存的“redirectUri”。
在我看来,我有 3 个选择:
a) 将 realmId 和 redirectUri 添加到同一个表中,一个将被填充,另一个为空,具体取决于正在使用的服务。当然,谁知道我是否必须在添加更多具有不同要求的服务时继续添加其他列?
b) 规范化数据,使得相似数据有一个表,但单独的表保存每个服务的唯一数据,并具有与具有相似令牌数据的表的外键。
c) 甚至不必费心将相似的数据存储在单个表中。而是为每个服务创建一个完全独立的表。
作为一个实用主义者而不是理论家,我倾向于 c)。造成这种情况的另一个原因是,一项服务基于帐户授予令牌,而另一项服务基于可能跨越多个帐户的用户授予令牌。
我知道这肯定是一个常见问题,但我只是不知道如何描述这个问题,以便我可以在搜索中找到有关它的有用信息。
我目前将金融交易存储在下表中(为简洁起见而缩短):
id INT
start DATETIME
end DATETIME
rate INT
usage INT
usage_fee INT
amount INT
commission_pct INT
payout INT
currency VARCHAR(5)
向客户收取的总金额计算如下:
amount = (end - start) * rate + usage * usage_fee
该平台收取以下费用/佣金:
commission = amount * (commission_pct / 100)
服务提供商收到的付款是:
payout = amount - commission
现在在上表中,存储支出在技术上是多余的,因为它可以如上所示计算。我的问题是,关于数据冗余存储这些类型的金融交易的常用方式/约定是什么?
例如,除了它们的总和(金额)之外,我还考虑将(end - start) * rate
和的结果单独存储在此表中。usage * usage_fee
我看到这样做的优点是:
这些专业人士是否有效,或者您会建议我完全规范化表格并在需要时计算值?
我知道根据“数据库设计原则”对表格进行规范化是正确的答案,但由于我正在处理财务数据,我不确定我是否 100% 满意使用计算值。
每笔交易的佣金率并不具体,但收取的佣金百分比将来很可能会发生变化,因此它与每笔交易一起存储。当然,如果存储实际的“佣金金额”,则无需存储佣金百分比。
那个时间点使用的commission_pct 和rate 存储在表中,这就是为什么将来为后续交易更改这些不是问题并且永远不会编辑现有交易的原因。此外,只有一个受控应用程序可以访问数据库。如果将来公式发生变化,不计算和存储结果将是一个问题。我倾向于应用程序计算这些值并一举存储“原始”值和计算值。
用户(用户 ID,电子邮件,姓名,地址,...)
用户身份
电子邮件
对我来说这似乎是个好主意,但后来我开始怀疑:“电子邮件”的唯一性是否违反了第三范式(3NF)?
我无法识别构成特定表的功能依赖关系(FD)的属性组合。虽然我了解在给定 FD 时规范化过程是如何工作的,但我无法翻译和识别给定表的 FD。
我的任务是创建一家公司的数据库,用于跟踪销售/包裹等的所有费用。这自然意味着为公司存储客户信息以识别所有消费者。
CREATE TABLE Customers (
id integer primary key,
address text not null,
name text not null,
email text unique not null,
phone text unique not null,
unique(name, address)
);
鉴于每个电话号码和电子邮件都与客户唯一关联,因此我选择代表客户表的信息。唯一约束允许来自同一家庭地址的多个人出现在表中。
我想看看我是否可以进一步规范化这个表,但是我无法识别属性来确定所需的 FD。
我学习关系设计已经有很长时间了,但我有一个模糊的记忆,它鼓励不要不必要地拆分表。例如,给定函数依赖
K -> A
K -> B
K -> C
我的假设是,“最佳”模式是公正的{KABC}
,而不是类似{KAB, KC}
或什至{KA, KB, KC}
. 至少在实践中,这是我看到数据库设计人员实现该表的方式。
然而,维基百科上的快速复习表明规范化形式主义
{KA, KB, KC}
. 由于 6NF 暗示了其他范式,这意味着它们甚至不可能做出这样的最小要求。我有点困惑,我一直都错了。“获得最少数量的表”的概念在正式的关系设计中真的没有任何作用吗,它只是一种常见的做法?
所以我正在做一个任务,我在维基百科上获取一个包含多个列(例如电影名称、类型、演员、情节等)的大量电影列表(30,000 多部)并将其上传到 Elasticsearch。但是,在这样做之后,我现在想使表格至少处于 1NF 中。我在数据库设计方面并没有真正的经验,我最后一次用 Normal Form 做任何事情是在几年前。所以我看着这张表并在想,我怎么能把它放到 1NF 中。例如,如果只有 1 列具有多个值,这很容易,但是当有多个具有多个值的列时,您会怎么做,如下所示。
电影名称 | 导向器 | 投掷 | 类型 | 维基页面 | 阴谋 |
---|---|---|---|---|---|
Chimmie Fadden Out West | 塞西尔·B·德米尔 | 维克多·摩尔 | 喜剧、西部 | https://en.wikipedia.org/wiki/Chimme_Fadden_Out_West | Chimmie被派往西部... |
海底两万里 | 斯图尔特·佩顿 | 路易斯·亚历山大、柯蒂斯·本顿、华莱士·克拉克、艾伦·霍鲁巴 | 动作、冒险 | https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) | 一个奇怪的... |
猫和金丝雀 | 保罗·莱尼 | 劳拉·拉普兰特、福雷斯特·斯坦利、克赖顿·黑尔 | 喜剧,恐怖,悬疑 | https://en.wikipedia.org/wiki/The_Cat_and_the_Canary_(1927_film)| 在一个... |
难道你只需要做这样的事情......
电影名称 | 导向器 | 投掷 | 类型 | 维基页面 | 阴谋 |
---|---|---|---|---|---|
Chimmie Fadden Out West | 塞西尔·B·德米尔 | 维克多·摩尔 | 喜剧 | https://en.wikipedia.org/wiki/Chimme_Fadden_Out_West | Chimmie被派往西部... |
Chimmie Fadden Out West | 塞西尔·B·德米尔 | 维克多·摩尔 | 西 | https://en.wikipedia.org/wiki/Chimme_Fadden_Out_West | Chimmie被派往西部... |
海底两万里 | 斯图尔特·佩顿 | 路易斯·亚历山大 | 行动 | https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) | 一个奇怪的... |
海底两万里 | 斯图尔特·佩顿 | 路易斯·亚历山大 | 冒险 | https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) | 一个奇怪的... |
海底两万里 | 斯图尔特·佩顿 | 柯蒂斯·本顿 | 行动 | https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) | 一个奇怪的... |
海底两万里 | 斯图尔特·佩顿 | 柯蒂斯·本顿 | 冒险 | https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) | 一个奇怪的... |
海底两万里 | 斯图尔特·佩顿 | 华莱士克拉克 | 冒险 | https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) | 一个奇怪的... |
海底两万里 | 斯图尔特·佩顿 | 华莱士克拉克 | 行动 | https://en.wikipedia.org/wiki/20,000_Leagues_Under_the_Sea_(1916_film) | 一个奇怪的... |
ETC?在将具有多个具有多个值的单元格的表格转换为 1NF 时,我肯定会遗漏一些非常简单的东西,但我不确定是什么。
谢谢。