AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 151547
Accepted
Mattia Nocerino
Mattia Nocerino
Asked: 2016-10-07 00:03:17 +0800 CST2016-10-07 00:03:17 +0800 CST 2016-10-07 00:03:17 +0800 CST

“累积快照”事实表中的“度量类型维度”

  • 772

我有一个累积快照事实表,用于跟踪终端中容器的进入和退出。

集装箱可以通过3 种不同的方式进出,所以我想创建一个特定的维度表,列出这 3 种可能的方式(火车、船只或卡车)。

然后我读了这篇文章,基本上说这种技术是错误的,但我不明白为什么。

第一篇:

有时,当事实表中有一长串事实稀疏地填充在任何单独的行中时,很容易创建一个度量类型维度,将事实表行折叠为由度量类型维度标识的单个通用事实。我们一般不推荐这种方法。虽然它删除了所有空的事实列,但它会将事实表的大小乘以每行中占用的列的平均数,这使得列内计算变得更加困难。当潜在事实的数量非常多(数百个)时,此技术是可以接受的,但适用于任何给定事实表行的只有少数。

我知道,如果为事务事实表实施“度量类型维度”,它可能会产生其他文章所说的问题,但如果用于累积快照事实,我看不到任何缺点。

第二篇文章:( 实施“度量类型维度”的一些缺点)

  1. [...] 如果我们使用“度量类型维度”,我们将失去这种分析能力。如果一项措施与其他措施不兼容,我们就无法将它们相加。
  2. [...] 我们的 SQL 需要运行以生成报告的遍数越多,报告就越慢。
  3. [...] 在 BI 工具上,如果您不放置度量类型过滤器,您就有可能让用户获得“垃圾信息”。从可用性的角度来看,这种设计是垃圾。

回应 Mark Storey-Smith 的回答

非常好的方法,我从来没有想过。

另一件事:将集装箱运入码头的车辆的每次进出都有一个唯一的 ID,它为我提供了其他信息,例如:车辆的预期到达,实际到达,如果是船只则码头,如果是卡车则收费站和许多其他信息...

这是 3 个不同的事实表,它们必须以某种方式链接到容器事实表。

我以为航次的ID是a degenerate dimension,所以直接进入集装箱事实表。所以,我的疑问是:我应该在集装箱事实表中添加 6 个不同的字段(vessel_voyage_in_key、vessel_voyage_out_key、train_voyage_in_key、train_voyage_out_key、truck_voyage_in_key、truck_voyage_out_key)还是仅添加 2 个动态链接到各种航程表的其他字段(voyage_in、voyage_out)?

我希望我的疑问是清楚的,谢谢。

database-design data-warehouse
  • 1 1 个回答
  • 549 Views

1 个回答

  • Voted
  1. Best Answer
    Mark Storey-Smith
    2016-10-13T09:47:48+08:002016-10-13T09:47:48+08:00

    我相信指南指的是一个广泛的事实表,其中大多数度量值为空:

    CREATE TABLE dbo.SparseFact
    (
        Dim1Key     INT NOT NULL
        , Dim2Key   INT NOT NULL
        , Dim3Key   INT NOT NULL
        , Dim4Key   INT NOT NULL
        , Dim5Key   INT NOT NULL
        , Value1    INT NULL
        , Value2    INT NULL
        , Value3    INT NULL
        , Value4    INT NULL
        , Value5    INT NULL
        , Value6    INT NULL
        , Value7    INT NULL
        , Value8    INT NULL
        ..
        , Value101  INT NULL
        , Value102  INT NULL
        , Value103  INT NULL
    );
    

    建议是有些人会看到所有的空值并决定改为这样做:

    CREATE TABLE dbo.DontDoThisFact
    (
        Dim1Key             INT NOT NULL
        , Dim2Key           INT NOT NULL
        , Dim3Key           INT NOT NULL
        , Dim4Key           INT NOT NULL
        , Dim5Key           INT NOT NULL
        , MeasureTypeKey    INT NOT NULL
        , Value             INT NOT NULL
    );
    

    不好。

    在你的场景中,我想我会看到这样的东西,这与你引用的文章中描述的场景非常不同。

    CREATE TABLE dbo.InventoryFact
    (
        ContainerKey        INT NOT NULL
        , TransportTypeKey  TINYINT NOT NULL
        , EntryDateTime     DATETIME NULL
        , ExitDateTime      DATETIME NULL
    );
    
    CREATE TABLE dbo.TransportType
    (
        TransportTypeKey    TINYINT IDENTITY(1,1) NOT NULL
        , EntryTransport    CHAR(10) NOT NULL
        , ExitTransport     CHAR(10) NOT NULL
    );
    
    INSERT
        dbo.TransportType
    SELECT
        EntryTransport
        , ExitTransport
    FROM
        (
        SELECT EntryTransport = 'Train'
        UNION
        SELECT EntryTransport = 'Truck'
        UNION
        SELECT EntryTransport = 'Vessel'
        UNION
        SELECT EntryTransport = 'N/A'
        UNION
        SELECT EntryTransport = 'Unknown'
        ) en
    CROSS JOIN
        (
        SELECT ExitTransport = 'Train'
        UNION
        SELECT ExitTransport = 'Truck'
        UNION
        SELECT ExitTransport = 'Vessel'
        UNION
        SELECT ExitTransport = 'N/A'
        UNION
        SELECT ExitTransport = 'Unknown'
        ) ex;
    

    对于其他问题...

    我会添加ExpectedEntryDate,ExpectedExitDate到Container/InventoryFact. 不太确定,如果没有所有数据元素的可见性,我可能会将EntryVoyageId和ExitVoyageId与任何其他退化数据项(卡车、火车等的标识符)一起作为一行放在一个单独的垃圾维度中。

    我将为这一事实添加 3 个新维度VesselVoyage,TruckVoyage以及TrainVoyage6 个 Voyage 键(入站/出站)(这是 6 个新键,而不是 6 个额外的行)。然后,您可以选择将Dock和放置Tollbooth在适当的航程维度中。如果将通用数据保留在这些维度 ( VesselFlag, TruckCapacity) 中,将特定数据保留在垃圾维度 ( VesselName, VesselMMSI) 中,它们的大小就不会爆炸。

    • 3

相关问题

  • MySQL VARCHAR 和 TEXT 数据类型有什么区别?

  • 存储计算值或根据要求重新计算它们更好吗?[复制]

  • 存储与计算聚合值

  • 在数据仓库中实现多对多关系有哪些方法?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve