Arian Asked: 2013-07-04 03:01:04 +0800 CST2013-07-04 03:01:04 +0800 CST 2013-07-04 03:01:04 +0800 CST 多维数据集中的度量和维度是什么 772 我对 Microsoft Sql Server 商业智能非常陌生,并且Analysis Service(但我已经使用 SQL Server 编程多年)。任何人都可以用简单的语言描述多维数据集中的度量和维度(如果可以使用图像)? 谢谢 sql-server ssas 2 个回答 Voted Best Answer Neil McGuigan 2013-07-04T09:17:36+08:002013-07-04T09:17:36+08:00 考虑您要分析的过程或事件。 假设您正在构建Lougle Analytics,并且想要分析对您网站的访问(而不是单页请求)。访问网站是一个过程。 事实表表示您要分析的过程或事件,在这种情况下,它是站点访问列表。您可以拥有任意数量的事实表,每个流程或事件一个。 在分析站点访问时,哪些事情可能对您有用? 有关 Web 浏览器的信息(品牌、屏幕分辨率……) 关于用户的信息(国家、州、城市、ISP,基于他们的 IP 地址) 关于访问开始时间的信息(年、季度、月、周、日) 访问时长 引荐页面、登录页面和退出页面(标题、url 路径) 访问期间访问的页面数 从技术上讲,您可以将所有这些都放在一个表中 - 就像在 Excel 中一样,但这会很快变得非常大,因此我们将进行一级标准化。维度设计通常只是“将分析所需的所有内容放在一张大表中”,然后规范化出一个级别。 因此,您的事实表将如下所示: web_browser_key bigint ip_address_key bigint start_date_key int referring_page_key bigint landing_page_key bigint exit_page_key bigint duration_seconds int number_of_pages_visited int 它有一堆引用其他表中的值的键值†和两个非键。非键是数值,称为Measures。你能取网络浏览器品牌名称的平均值吗?不,所以它是一个维度。你能取平均访问时间吗?是的,所以这是一个措施。 其他表称为维度表,ip_address维度表可能如下所示: ip_address_key bigserial primary key, /* use meaningless surrogate keys */ ip_address inet unique, country text, division text, locality text, latitude numeric(8,6), longitude numeric(9,6) 请注意,它没有标准化:国家可以来自城市(地区)。然而,在数据仓库中,我们首先关心的是促进分析。通过促进分析,我的意思是避免深度连接。 请注意,维度表中的一些数据是分层的:国家 > 部门 > 地区。您的 OLAP 服务器(希望如此)理解层次结构以支持向下钻取操作。 逻辑多维数据集只是您正在使用的维度和度量的集合。与魔方不同,它可以有超过 3 个维度。只需将维度视为数据集中的一列。 OLAP是您可以对数据集执行的一组操作,例如旋转、切片、切块、钻孔。想想 Excel 数据透视表。OLAP 服务器有助于 OLAP 操作。 † 通常没有外键 OCDan 2013-07-04T03:06:29+08:002013-07-04T03:06:29+08:00 下图中是基本星型模式的示例。维度是 Dim_Tables。 这些通常是您要用来分析数据的值。因此,您想查看特定日期范围内特定国家/地区的特定产品销售情况。 在 fact_sales 表中,您只有一个度量,即 Units_Sold。 度量(在最简单的级别)只是您在根据维度中的标准进行分析时想要聚合的内容。 如果您想知道其他更具体的内容,请告诉我。
考虑您要分析的过程或事件。
假设您正在构建Lougle Analytics,并且想要分析对您网站的访问(而不是单页请求)。访问网站是一个过程。
事实表表示您要分析的过程或事件,在这种情况下,它是站点访问列表。您可以拥有任意数量的事实表,每个流程或事件一个。
在分析站点访问时,哪些事情可能对您有用?
从技术上讲,您可以将所有这些都放在一个表中 - 就像在 Excel 中一样,但这会很快变得非常大,因此我们将进行一级标准化。维度设计通常只是“将分析所需的所有内容放在一张大表中”,然后规范化出一个级别。
因此,您的事实表将如下所示:
它有一堆引用其他表中的值的键值†和两个非键。非键是数值,称为Measures。你能取网络浏览器品牌名称的平均值吗?不,所以它是一个维度。你能取平均访问时间吗?是的,所以这是一个措施。
其他表称为维度表,
ip_address
维度表可能如下所示:请注意,它没有标准化:国家可以来自城市(地区)。然而,在数据仓库中,我们首先关心的是促进分析。通过促进分析,我的意思是避免深度连接。
请注意,维度表中的一些数据是分层的:国家 > 部门 > 地区。您的 OLAP 服务器(希望如此)理解层次结构以支持向下钻取操作。
逻辑多维数据集只是您正在使用的维度和度量的集合。与魔方不同,它可以有超过 3 个维度。只需将维度视为数据集中的一列。
OLAP是您可以对数据集执行的一组操作,例如旋转、切片、切块、钻孔。想想 Excel 数据透视表。OLAP 服务器有助于 OLAP 操作。
† 通常没有外键
下图中是基本星型模式的示例。维度是 Dim_Tables。
这些通常是您要用来分析数据的值。因此,您想查看特定日期范围内特定国家/地区的特定产品销售情况。
在 fact_sales 表中,您只有一个度量,即 Units_Sold。
度量(在最简单的级别)只是您在根据维度中的标准进行分析时想要聚合的内容。
如果您想知道其他更具体的内容,请告诉我。