假设我有一个对象,我使用装饰器为这个对象添加属性,然后我想将对象及其属性存储在关系数据库中,并能够对这些存储的属性运行查询。
例如,假设我有一个包含厨房设备的数据库。基本属性将包括制造商、型号和描述等内容。厨房设备中,有的用电,有的用气,有的用水,有的需要下水道,有的需要防火,有的需要日常维护等等。这些属性一般不是布尔标志,而是比较丰富类本身的集合。因此,如果我想将我所有的“设备”保存在一个表中,我必须找到一种方法来存储所有这些属性。
我正在使用装饰器向对象添加属性,而不是使用继承来减少类的数量,因为我不想拥有 2^(属性数量)个类。
到目前为止我想到的两件事是每个属性的表和每个属性的字段。
每个属性的表有更多的连接来重建对象,每个属性的字段对于许多对象有很多空字段,并且每当我引入一个新的唯一属性时都需要添加一个字段。除了使用上述两种方法之一之外,是否有一些(理智的)方法来解决这个问题?我知道这可以在某些 NoSQL 数据库中完成,这个问题特别涉及关系数据库。
您的问题中不清楚您是否需要在数据库查询中使用这些动态属性。我假设你不会。
有了这个假设,我实际上可以向您指出我过去使用过的实现,尽管我要添加一个免责声明:在这些日子里,您真的不应该这样做,除非您真的坚持使用当前的数据库并且根本无法将此对象集合的持久性移动到它似乎属于的 NoSQL 数据库中。
那么,答案是:您可以使用一个对象序列化引擎,例如 Java 中的那个(也许您使用的是另一种语言,但我相信它有某种方法可以做同样的事情),然后创建存储序列化对象的数据库表。然后,为了能够查询此表,您有以下选项:
如果您在所有对象之间具有公共属性,则可以为查询中需要的每个属性创建一个列,然后在您有插入或更新时根据正在序列化的对象填充它们。
如果需要使用一些只存在于少数对象中的属性进行查询,可以在原表中创建一个外键为对象唯一ID的表,然后添加查询所需的列。
您可以根据需要混合上面的选项 - 在我的例子中,我最终得到一个表来存储序列化对象,给定唯一 ID,然后是多个表用于查询。有一些数据重复,但它是根据必须在这些对象上运行的许多报告的性能测量来完成的。你的旅费可能会改变。
最后,无论您选择哪种查询结构,都会给您一个相对较好的关系数据库查询优势组合,同时保留程序使用的对象结构,因为反序列化过程应该重新创建对象(或对象图,考虑到使用装饰器),就像在序列化之前一样。
然而,我觉得我应该再次强调这一点:我认为在这个时代不应该这样做,除非你有真正的经济/政治/任何理由这样做。
如果您有很多属性要附加到一个对象,并且不想创建列,那么您必须将这些属性存储在一个可以搜索的列中 - 通过“喜欢”或自由文本搜索功能或通过使用您的数据库可能支持或不支持的复杂列类型(即 PostgreSQL 的JSON 类型)。
通过为每个标记存储一个人类可读的 TLA 代码,我成功地在单个列中存储了一组开/关标记,如果代码存在,则标记已设置。这很容易使用 like 子句查询(假设每个代码都是唯一的)。
正如其他人所提到的,这取决于您需要能够查询的内容。你需要索引吗?聚合?外键?加入?
就个人而言,会采用单个表的方法,其中包含重要属性的各个字段,其余的我将存储在同一行的 xml 文档中。Xml 是灵活的,因此非常适合可选属性。
大多数 RDBMS 现在都支持 JSON 数据类型。您可能有一列具有 JSON 数据类型并存储 JSON 数据。有支持 JSON 的 SQL 函数,如 ISJSON、JSON_QUERY、JSON_OBJECT、JSON_VALUE 等。
https://dev.mysql.com/doc/refman/5.7/en/json-function-reference.html https://learn.microsoft.com/en-us/sql/t-sql/functions/json-functions -transact-sql?view=sql-server-ver16
根据我的经验,我保存 JSON 数据。然后生成散列并将其保存在一个新列中。此哈希有助于更快地检索数据以进行精确匹配。