我在一个平台上工作,该平台从多个来源(Facebook、Twitter 等)收集帖子并将它们保存到数据库中。计划是创建一个名为 posts 的表,其中包含所有平台的所有必要字段,甚至是特定于平台的字段。因此,保存的 Facebook 帖子可能包含一个名为转推(特定于 Twitter)的空列。
另一种解决方案是创建一个 Supertype 帖子,它将包含所有一般信息和类型(facebook、twitter),并与所有平台特定的表有关系。
第三个选项是通用表和平台特定表,彼此没有关系,帖子包含所有通用数据,平台特定(facebook_posts)表包含通用数据和平台特定数据,它们彼此没有关系,仅与用户有关.
您认为性能和未来验证的最佳选择是什么?我们可能想添加更多平台,并可能删除\更改令人兴奋的平台。该数据库在未来的某个时间点可能包含数以万计的帖子。
选项 1:一张表中的所有信息
Table name: Posts
id
title
facebook_id
retweets
选项 2:具有多个关系的超类型
Table name: SuperPosts
id
type
title
Table name: facebook_posts
id
facebook_id
shares
Table name: twitter_posts
id
twitter_id
retweets
选项 3:通用和平台特定彼此没有关系
Table name: Posts
id
platform_id
text
Table name: facebook_posts
id
facebook_id
facebook_text
shares
Table name: twitter_posts
id
twitter_id
twitter_text
retweets
你问的是如何在关系数据库上实现继承,你提到的 3 种方法基本上是 3 种最常见/基本的方法。有关它们的一些讨论,请参阅https://stackoverflow.com/questions/3579079/how-can-you-represent-inheritance-in-a-database。
没有“最好”的方法来做到这一点——这完全取决于您打算如何使用您的架构,以便它方便您之后的查询。
对于杂项列,尤其是那些可选的列,将它们扔进
JSON
列中。不要计划对 Json 列中的任何内容进行过滤或排序。