因为它们包含不相关的数据,所以我在拆分具有相似结构的表时的推理是否正确?
我将用一个例子来解释这种情况:
假设有一台服务器托管在线游戏的数据库。该游戏有多个并行运行的游戏世界。游戏的每个游戏世界的模式都是相同的,假设游戏的数据库设计中有 15 个关系表。还假设服务器决定不删除旧服务器的数据,而是将其存档。
方法一:
现在,由于游戏世界托管在一台服务器上,将所有游戏数据放入一个包含 15 个表的数据库中似乎是合乎逻辑的。示例表的表结构可能如下所示:
CREATE TABLE `table` (
playerid ...,
score ....,
gameworldid ...,
PRIMARY KEY(gameworldid,playerid)
) ENGINE = InnoDB
所以,每次我需要展示得分最高的前 10 名球员时,我都必须做类似的事情SELECT * FROM table WHERE gameworldid = {id} ORDER By score DESC LIMIT 10
方法二:
由于一个游戏世界的数据与另一个游戏世界的数据没有任何关系(结构除外),我们可能会为不同的游戏世界制作不同的数据库,或者为每个游戏世界制作不同的表格集。表结构看起来像这样:
CREATE TABLE `gameworldid_table` (
playerid ...,
score ....,
PRIMARY KEY(playerid)
) ENGINE = InnoDB
在这种情况下,得分查询最多的前 10 名玩家将是SELECT * FROM table ORDER BY score DESC LIMIT 10
问题是,在这种情况下哪种方法更好?正在使用的存储引擎是InnoDB
,总的来说,最大的合并表中预计有 60 亿行和更多的行,以及 500 和更多的游戏世界。(由于旧数据未被删除,因此当游戏世界重新启动时,将创建一个新的游戏世界。
在我看来,方法 2优于方法 1的优点是:
- 主键和索引占用的空间更少,使它们更有效率
- 与方法一中的合并表相比,排序、连接和其他操作更快,方法一包含许多可能会妨碍这些操作的额外数据。
- 与较大表中的插入相比,插入速度更快
- 数据不会永远堆积在同一张表中
方法 1优于方法 2的优点是什么?
- 更好的可管理性:与 500 * 15 个表相比,15 个表听起来更好,如果您必须进行一些手动修复(很少见)。
- 听起来不那么疯狂
- 太多的表可能只会使数据库变慢(不知道事实,无法在互联网上找到它)
我想我对优点和缺点的看法可能有偏见,但我真的很想知道如果我选择一种方法而不是另一种方法,我会遇到什么所有问题。另外,这个解决方案还有其他可能的解决方案吗?
假定合理的设备和良好的索引结构,您的问题可能与性能无关,而与您面临的其他影响有关。
方法 1 意味着一些额外的编程复杂性来处理过滤每个表中的行以限制对单个游戏世界的访问。这也意味着如果您需要恢复游戏世界,您将不得不 (a) 恢复所有游戏世界(因为它们在同一个数据库中)或 (b) 将一个数据库恢复到恢复数据库,然后编写适当的游戏世界数据脚本从 Recovery 到您的 Gameworlds 数据库。
方法 2 意味着您需要能够跨多个数据库管理架构更改。这可以根据需要通过编写脚本来完成。为某些游戏世界选择不同的模式也更容易,但这会增加管理开销。但是,如果单个游戏世界崩溃,您可以恢复最新的良好备份并使其重新运行。
几年前,一些 Microsoft 人员撰写了他们对多租户数据库的看法。请参阅:http: //msdn.microsoft.com/en-us/library/aa479086.aspx
在您描述的大小范围内,拥有更多表本身不会导致性能问题。
选择您的方法应该考虑利用您的优势,以便您(和您的项目成员)拥有一个可以轻松管理的系统。
如果你有少量的游戏词并且不期望在那个方向上大规模扩展(例如允许某些或所有类别的用户创建他们自己的世界)那么你在这里拥有的基本上与“标准”相同多租户架构选择——只有每个租户都是游戏的一个实例而不是完全不同的客户端。
假设游戏世界根本不需要共享数据(用户是否存在于多个世界中并且需要/想要在他们之间共享数据?)那么我很想采用单独的数据库方法但不是为了即时性能原因(通过良好的设计,包括索引选择和足够的硬件,一个世界和同一个数据库中的多个世界之间的性能不必有任何差异)。将每个世界拆分为自己的数据库可以消除一些代码复杂性,因为您永远不需要了解多个世界(每个数据库只有一个),并且随着您的需求增长,您可以提供额外的扩展选项:您可以将数据库角色拆分为多个通过移动世界数据库,机器(或者如果 I/O 是瓶颈而不是其他任何东西,那么更容易将它们拆分到不同的主轴组之间,这样多台机器就会过度杀伤)。
在这里和一般情况下搜索“多租户架构”,您会发现很多讨论常见方法及其优缺点的好文章。开始的一篇示例文章是http://msdn.microsoft.com/en-us/library/aa479086.aspx