bfmcneill Asked: 2021-04-11 23:46:51 +0800 CST2021-04-11 23:46:51 +0800 CST 2021-04-11 23:46:51 +0800 CST 谷物特有的文本应该存储在事实表还是维度表中? 772 我正在使用 yelp 数据集为用户评论建模星型模式。 每个用户评论都有一个业务维度键、用户维度键和与评论关联的一堆数据。所有评论数据都是数字的,除了他们为评论输入文本的字段(存储在名为 text 的列中)。 将文本数据存储在事实表中是否有意义,因为它与事实的粒度有关?还是应该将其放置在以与事实表相同的速率增长行数的维度表中? database-design data-warehouse 1 个回答 Voted Best Answer JeromeFr 2021-04-12T23:23:15+08:002021-04-12T23:23:15+08:00 是的,将文本保留在事实表中确实有意义,原因有两个: 它和事实是一样的,所以有一个维度确实可以让它和事实表一样快地增长 它不链接到事实表中的其他属性,因此可以直接在事实表中将其建模为退化维度(即使它通常更多地应用于 ID 或标签)。 当您汇总评论时,文本不会成为您的选择语句的一部分,因此它不会影响性能。只有在最精细的级别显示数据时才会出现。 如果您发现您有一些其他低基数的描述性属性,由于它们未链接到其他属性而无法轻松放入现有维度,您还可以使用所有这些不相关的属性构建一个垃圾维度。
是的,将文本保留在事实表中确实有意义,原因有两个:
当您汇总评论时,文本不会成为您的选择语句的一部分,因此它不会影响性能。只有在最精细的级别显示数据时才会出现。
如果您发现您有一些其他低基数的描述性属性,由于它们未链接到其他属性而无法轻松放入现有维度,您还可以使用所有这些不相关的属性构建一个垃圾维度。