AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 6555
Accepted
Tommy O'Dell
Tommy O'Dell
Asked: 2011-10-06 18:10:44 +0800 CST2011-10-06 18:10:44 +0800 CST 2011-10-06 18:10:44 +0800 CST

中位数、众数、百分位数和 OLAP

  • 772

我是新手,想了解 OLAP,我有几个问题。

  • 问题 1: OLAP 多维数据集可以存储中位数、众数、百分位数吗?
  • 问题 2:用户编写的 MDX 查询能否返回行级数据的摘要?(例如:交易百分比 > 100 美元)。或者多维数据集设计者必须将它添加到多维数据集中?
  • 问题 3:现在是否有任何 OLAP 产品提供访问行级数据的机制?哪个?

我们的 IT 部门正在寻找有关我们在使用特定 MS Analsis Services ROLAP 多维数据集时遇到的问题的反馈。我们无权访问它背后的关系数据库,需要执行当前在多维数据集中无法作为度量值的计算。

让我看看我是否有这个权利。

  1. 立方体可以提供计数、平均值、比例、标准差的统计信息。
  2. 如果多维数据集设计器提供的度量未满足特定统计信息,我们可以编写 MDX 查询来获取它吗?或者他们是否需要更改多维数据集以便从行级数据预先计算它?
  3. 多维数据集无法提供中位数、众数或百分位数等统计信息,因为这些统计信息无法正确聚合。

我正在阅读 Leland Wilkinson 的The Grammar of Graphics和他关于数据挖掘和 OLAP 的章节,他说

这些 [立方体运算] 与计数、均值、比例和标准差等统计数据配合得很好。对子类的简单聚合可以通过对总和、平方和和其他项在线性函数中组合以产生基本汇总统计数据进行运算来计算。

它们不适用于中位数、众数和百分位数等统计数据,因为这些统计数据的汇总不是它们汇总的统计数据。例如,中位数的中位数不是聚合的中位数。

他接着补充说:

然而,最近出现了一种更复杂的 ROLAP 模型。通过多种技术,可以让统计算法通过关系模型实时访问原始数据。这种方法比数据立方体等结构提供的刚性聚合更有希望。

在这种架构最优雅的形式中,应用程序可以请求远程连接以提供有关其数据处理方法的信息,并根据返回的信息采取适当的行动。在这种形式下,组件架构可以实现分布式计算的真正承诺:独立于站点、操作系统或语言的设计和执行。

那是大约 2005 年写的。有人知道使用这种方法来允许行级数据访问的产品吗?

ssas statistics
  • 1 1 个回答
  • 2556 Views

1 个回答

  • Voted
  1. Best Answer
    ConcernedOfTunbridgeWells
    2011-10-14T04:44:01+08:002011-10-14T04:44:01+08:00

    按顺序回答您的问题:

    1. 多维数据集不存储中位数、众数(甚至平均值),但您可以编写计算它们的查询并将它们作为计算度量嵌入多维数据集中。嵌入这种计算的能力是 OLAP 技术的主要独特卖点之一。
    2. 如果您有一个可以识别单个行的维度(可能是从事实表上的标识符派生的退化或“事实”维度),那么您可以基于单个行进行查询。但是,OLAP 在维度和聚合方面起作用,因此您需要一个能够识别各个行的维度(聚合由一个值组成)。
    3. 任何 OLAP 工具都可以执行 (2) 中描述的操作,而且它们通常支持称为“钻取”的机制,在该机制中,多维数据集将返回您钻取的给定切片下的事务数据的边界。

    如果您想要执行在多维数据集脚本中不直接可用的计算,许多 OLAP 工具(例如后期令人遗憾的 ProClarity)将允许您制定涉及基于 MDX 的自定义计算的查询。除非多维数据集没有您进行实际计算所需的信息,否则自定义 MDX 计算应该能够支持您需要的任何计算。

    尽管 OLAP 查询传统上与聚合统计查询相关联,但如果您有一个允许深入了解您需要的细节的维度,那么当然可以制定查询来计算中位数、百分位数或直方图查询,从中可以推断或计算模式。

    例如,这里有一个基于排名的帕累托分析查询示例。

    许多多维数据集产品可以在混合或关系 OLAP 模式下运行,它们本身不保存数据,而是从底层数据库查询数据。此外,纯 ROLAP 工具(如 Business Objects、Report Builder 或 Discoverer)可以从底层数据库查询并逐行执行工作。但是,它们往往缺乏专用 OLAP 产品的复杂性,并且它们没有太多开箱即用的统计分析能力。

    • 5

相关问题

  • SSAS:移动 tempdb 数据库

  • OLAP 多维数据集中的布尔字段

  • SQL Server 2008 分析服务 DSO 属性

  • SSAS 维度层次结构导致部署错误

  • 什么是数据库统计信息,我如何从中受益?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve