我有一个非常基本的 ERD,它是为一个简单的数据库创建的,该数据库存储了一些关于由非营利组织帮助提供一些基本需求的难民家庭的信息。
ID 是 Parent 的主键和 Children 的外键。
诚然,我是数据库新手,所以我正在寻找有关如何改进此设计的提示。
我正在考虑的另一种方法:
Parent(parent_id, lastName, firstName, phone, notes)
Home(Address, Street, Apartment, City, Zipcode)
Stats(parent_id,DateOfArrival, DateReceived, CountryOfOrgin, Status)
Children(parent_id, child_id, firstName, gender, age, shoe, notes)
但我不确定在这种情况下连接表所需的主键和外键。查询我是否可以正确连接似乎更容易。
一个示例查询可能类似于“选择所有具有相同街道名称的孩子”(这将使运送物资更容易一些)。
谢谢你。
一项要求和几点建议:
要求:您也应该有一个单独的子记录主键。也就是说,父记录和子记录都应该有名为“id”的字段。然后,子记录应该有一个名为“parent_id”的字段。并且这个键应该有父级的 id 值。那有意义吗?您可能已经进行了此设置,但我看不到您显示的架构中的字段。
我会考虑@JD 的建议,即为 CountryOfOrigin 设置一个单独的表格。从技术上讲,你可以为城市做同样的事情。但是我要提出一个警告:这完全取决于您将如何查询以及您对 SQL 的熟悉程度。是的,您的数据的完美规范化版本会从单独的表中提取国家和城市,但这会增加(某些)查询的复杂性,因为您必须加入这些表。同样,许多人将整个地址放在单独的表中,因为人们可以有多个地址(永久地址、邮寄地址、以前的地址等)。
就个人而言,我不是规范化纯粹主义者。实际上,如果这个非营利组织的需求很简单,并且他们/您在加入表格方面的经验非常基础,那么就不要对数据进行规范化。但是,如果它们使您的事情变得更容易,请考虑所有这些可能的规范化。
例如,如果您的客户可能想要存储多个地址,那么值得将其分离到另一个表中。如果他们不需要这种能力,那就不要这样做。
同样,如果您认为您需要为每个国家/地区存储其他数据,或者按国家/地区查询和过滤相当多的数据,那么将其分离到自己的表中可能是有意义的(注意:您可以在主表中的一个国家/地区字段,但这里分开到另一个表的原因是为了确保数据完整性。在您当前的设置中,没有什么能阻止一个人将美国、另一个美国和另一个美国记录为国家。但是如果你有一个带有国家名称的表,并指向它,那么数据库将防止这种类型的数据不一致)。
因此,与往常一样,它归结为您的特定需求 :-) 但希望这些技巧能够为您指明正确的道路。
不确定对于这样一个简单的用例有很多建议,但我建议也将
LastName
字段存储Children
在他们各自的表中,例如离婚父母姓氏不同,或者孩子有一天结婚并且他们的姓氏变化等类似的东西
CountryOfOrigin
通常更好地存储在他们自己的查找表中,每个国家都有一个唯一的 ID。这允许您通过将 存储CountryId
在Parent
表中来获得更好的数据完整性,该表指向查找表中国家/地区的规范化名称。参照完整性也可以通过外键关系强制执行,以确保不会将无效值保存到Parent
表中。