AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题

问题[olap](dba)

Martin Hope
ERJAN
Asked: 2024-04-09 03:58:25 +0800 CST

数据仓库引擎、数据仓库、olap引擎、olap数据库、数据存储引擎与数据存储之间有什么区别?

  • 5

我需要澄清关键字“引擎”以及它背后的功能。我认为引擎是一个更大的东西——数据库的一个更小的组件。就像“汽车发动机”位于汽车内部一样。

那么 dwh 引擎可以插入更大的数据仓库吗?Olap引擎可以用作实际olap db的组件吗?

我在 Medium.com 上发现了这个数据景观图像,有 2 个不同的类别:olap db 和 olap 引擎。

olap_db_vs_olap_engine

由于它们具有重叠的功能,有什么区别?

olap
  • 1 个回答
  • 31 Views
Martin Hope
Rott
Asked: 2017-02-09 12:55:27 +0800 CST

OLAP cube 是重复数据吗?

  • 1

OLAP 多维数据集是数据的重复还是只是对原始表的引用?或者我可以控制它吗?

olap duplication
  • 1 个回答
  • 222 Views
Martin Hope
Sir Swears-a-lot
Asked: 2016-11-02 16:37:48 +0800 CST

SSAS 如何计算标准差

  • 2

我正在尝试跨标准偏差和平均值等一系列数据计算各种统计计算。

数据来自许多不同的“数据源”。这些都保存在一个维度中。

我尝试使用此示例STDDEVP中所示的函数,该函数对度量进行操作。

但结果是错误的。我认为这是错误的,因为它处理的是总数而不是原始数据。[Sum of Values] 是对事实表中的数据求和的标准聚合度量。

按照格雷格提供的链接,我现在正在使用这个:

CREATE MEMBER CURRENTCUBE.[Measures].[Standard Deviation]
 AS  (([Measures].[Sum of Values]^2 - (([Measures].[Sum of Values]^2)/[Measures].[Count of Values])/[Measures].[Count of Values])^0.5),
FORMAT_STRING = "#,##0.00;-#,##0.00", VISIBLE = 1 ,  ASSOCIATED_MEASURE_GROUP = 'Fact TS Data'; 

这给了我这个:

在此处输入图像描述

这仍然是不正确的。

使用 SQL 如果我使用STDDEV以下查询计算 Air Temp:

  SELECT stdevp([Value])
  FROM [EnvironmentalDataMart].[DDS_HILLTOP].[factTimeSeries]
  where [DETL_DataSourceSurrogateKey] = 78

我得到:6.13770334742149

如何让 MDX 查询计算STDDEV我的维度中的每个数据源?

我也尝试过使用“无聚合”的 Measure,但它没有返回任何内容。

ssas olap
  • 3 个回答
  • 1541 Views
Martin Hope
Leftium
Asked: 2016-05-13 00:35:47 +0800 CST

用于分析查询的 MDX 与 SQL 的好例子

  • 12

在进行分析查询时,任何人都可以向我展示 MDX 相对于常规 SQL 的优势的一个很好的例子吗?我想将 MDX 查询与给出相似结果的 SQL 查询进行比较。

维基百科说:

虽然可以将其中的一些转换为传统 SQL,但即使对于非常简单的 MDX 表达式,也经常需要合成笨拙的 SQL 表达式。

但是既没有引用也没有例子。我完全清楚底层数据必须以不同的方式组织,并且 OLAP 每次插入都需要更多的处理和存储。(我的建议是从 Oracle RDBMS 迁移到Apache Kylin + Hadoop)

背景:我试图说服我的公司,我们应该查询 OLAP 数据库而不是 OLTP 数据库。大多数 SIEM 查询大量使用分组、排序和聚合。除了性能提升之外,我认为 OLAP (MDX) 查询会比等效的 OLTP SQL 更简洁、更容易读/写。一个具体的例子可以说明这一点,但我不是 SQL 专家,更不用说 MDX ......


如果有帮助,以下是针对过去一周发生的防火墙事件的示例 SIEM 相关 SQL 查询:

SELECT   'Seoul Average' AS term, 
         Substr(To_char(idate, 'HH24:MI'), 0, 4) 
                  || '0'        AS event_time , 
         Round(Avg(tot_accept)) AS cnt 
FROM     ( 
                SELECT                     * 
                FROM   st_event_100_#yyyymm-1m# 
                WHERE  idate BETWEEN trunc(sysdate, 'iw')-7 AND trunc(sysdate, 'iw')-3 #stat_monitor_group_query#
                UNION ALL 
                SELECT * 
                FROM   st_event_100_#yyyymm# 
                WHERE  idate BETWEEN trunc(sysdate, 'iw')-7 AND trunc(sysdate, 'iw')-3 #stat_monitor_group_query# ) pm
GROUP BY substr(to_char(idate, 'HH24:MI'), 0, 4) 
                  || '0' 
UNION ALL 
SELECT   'today' AS term , 
         substr(to_char(idate, 'HH24:MI'), 0, 4) 
                  || '0'        AS event_time , 
         round(avg(tot_accept)) AS cnt 
FROM     st_event_100_#yyyymm# cm 
WHERE    idate >= trunc(sysdate) #stat_monitor_group_query# 
GROUP BY substr(to_char(idate, 'HH24:MI'), 0, 4) 
                  || '0' 
ORDER BY term DESC, 
         event_time ASC
olap mdx
  • 3 个回答
  • 16824 Views
Martin Hope
selva
Asked: 2015-06-19 02:16:08 +0800 CST

将非数值值作为事实表中的度量

  • 1

根据我关于将非数字值作为衡量标准的研究,我发现非数字不是最佳值。

所以我计划保持数值。我的场景是“员工出勤”,衡量标准可能是“临时休假”、“病假”、“不知情休假”、“补偿”。

是我需要为所有这些(4 个措施)维护列,并将根据相应用户的状态进行更新。如果我保持这样的态度,则意味着如果添加新的意味着它将像立方体的结构发生变化一样。

这将是一个好的解决方案还是任何可用的最佳解决方案?

database-design olap
  • 1 个回答
  • 2473 Views
Martin Hope
good-to-know
Asked: 2015-04-04 05:08:31 +0800 CST

获得计算成员的不同计数?

  • 2

我正在使用 SSAS 并创建了一个链接到 SQL Server 上的 Fact_SalesMetrics 的度量值组。在这方面,我有七项措施。除了具有 Distinct Count 聚合的 Sales Invoice 之外,所有度量都具有 Sum 聚合。

一切都很好。我需要将“CustomerID”的聚合也设为 Distinct 计数,但我做不到。它说我错误状态,“测量组有多个不同的计数测量。”

所以,我需要将这两个度量的聚合作为 DistintCount。我怎样才能?任何帮助将不胜感激。

我想创建一个计算成员来实现这一点,但失败了,因为我不知道我必须给出什么表达!

ssas olap
  • 2 个回答
  • 5865 Views
Martin Hope
Toranaga
Asked: 2015-02-03 05:13:57 +0800 CST

如果您有 OLAP,SQL 连接有什么意义?

  • 0

我想从业务分析的角度理解使用 SQL 连接的目的。

假设我想分析客户数据。如果我可以使用似乎无处不在的立方体或表格模型,我为什么要使用连接语句从多个表中提取数据,甚至 excel 也具有此功能。我可以使用点击即席、切片器和其他过滤和聚合,如果我理解正确的话会快很多,如果我想做一个非常复杂的分析,我可以在 excel 示例中编写 MDX 查询或立方体公式。

SQL 连接可以帮助我做什么?

join olap
  • 1 个回答
  • 1420 Views
Martin Hope
Tom Tucker
Asked: 2013-07-04 10:19:00 +0800 CST

将数据从 OLTP 传输到 OLAP 数据库

  • 4

同时具有 OLTP 和 OLAP 数据库的系统会定期将数据从 OLTP 数据库移动到 OLAP 数据库,以便可以基于 OLAP 数据库生成报告。

这个过程的官方术语是什么?在线上有这个过程的概述吗?

olap
  • 2 个回答
  • 7346 Views
Martin Hope
ObiObi
Asked: 2011-12-01 10:18:02 +0800 CST

处理数据集市中随时间变化的属性

  • 3

我浏览了整个网站列表,这是我认为最好的匹配。这实际上与数据库管理无关,更像是数据库设计。请原谅我并将我指向正确的站点。

我正在为基本的 BI 系统设计一个数据库。此刻我碰壁了,就是这样(使用虚拟数据进行解释):

假设我的事实表包含以下信息:

John Doe flew from LAX to ATL on 1 Nov in flight AB-123

维度及其属性为:

  • 传单 - 名称、俱乐部
  • 机场 - 城市,代码
  • 日期 - 年、月、日
  • 航班 - 代码、标准、延误、价格

现在,我可以很容易地生成这样的报告:

Airport --> LAX  DFW  ORD  ATL Total
Gold         50   40   10   25   125
Silver      240  300   95  140   775
Bronze     1000 1500  800 1800  5100
Total      1290 1840  905 1965  6000

使用如下查询:

select fd.club, ad.code, count(f1.id) from flyer fd, airport ad, fact1 f1
where fd.id = f1.fid and ad.id = f1.aid and month(f1.date) = 10
group by f1.club, ad.code;

但我的问题来自传单的“俱乐部”状态是一个移动目标。今天处于黄金状态的传单可能在 10 月份处于白银状态,所以我在这里将他算在错误的组中。因此,我想我需要一个像这样的单独事实表:

 John Doe entered Bronze club on 8/15
 John Doe entered Silver club on 10/20
 ...

“俱乐部”作为原始传单维度的属性退出。相反,出现了一个新的俱乐部维度。

然后为了生成我需要的报告,我加入了这两个事实表。

我在正确的轨道上吗?或者是否有其他更简单的解决方案?我能想到的另一种选择是将俱乐部包含在原始事实表中,在 ETL 过程中处理它。所以事实变成了:

John Doe of Silver Club flew from LAX to ATL on 1 Nov in flight AB-123

请让我知道哪种方法更好,或者是否有第三种方法。

database-design olap
  • 3 个回答
  • 1493 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve