hitchhiker Asked: 2023-04-24 18:01:22 +0800 CST 我应该使用具有多个维度的单列和柱状数据吗? 6 我正在使用对 Parquet 文件执行查询的 Apache Iceberg。数据保存了很多类型的事件和它们各自的数值。我在犹豫是为事件类型设置一列还是为每个事件设置一列更有效。 单一事件类型列: VS 每种事件类型的专用列: 我想知道如果我想运行一个group by查询col1,col2理论上event_type如果有一个专门的列,那么event_type数据库将不得不扫描更少的数据,而不是当所有事件类型都存储在一个单列。 在为列式数据存储中的此类数据设计模式时,最佳做法是什么? database-design