AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 238824
Accepted
WadeH
WadeH
Asked: 2019-05-23 13:03:41 +0800 CST2019-05-23 13:03:41 +0800 CST 2019-05-23 13:03:41 +0800 CST

Modelo Tabular SSAS ou Banco de Dados Relacional SQL para novo Datawarehouse? O SSAS ainda é uma boa tecnologia para aprender?

  • 772

Estou no processo de criação de um data warehouse usando o SQL Server para minha empresa. Eu criei um POC com um banco de dados SQL Relational simples com alguns (cerca de 10) Procs armazenados para o processo ETL. Agora que tenho a adesão dos negócios para chegar a um estado de produção, onde triplicarei os dados, é o momento certo para garantir que a tecnologia que uso seja mais adequada às nossas necessidades e esteja alinhada com as práticas recomendadas gerais.

Estaremos processando cerca de 500 mil registros por dia, com uma estimativa máxima de cerca de um milhão por dia. O POC então agregou todos esses dados em pedaços de 5 minutos por cliente por dia nos últimos 4 anos. Total sendo um pouco mais de 500k slots de tempo, para cada fato (POC tinha 4 tabelas de fatos) para cada cliente (Vamos planejar para 25). Portanto, para o POC, estamos analisando aproximadamente 50 milhões de linhas em todos os fatos por cliente e horário. Isso deixa as visualizações finais dos dados em quantidades menores, já que os últimos 6 meses satisfazem 85% de todas as perguntas, o que significa que devemos estar sentados com conjuntos de resultados de aproximadamente 250k linhas por 85% do tempo, se não menos. Dado que espero triplicar os dados, vamos chamá-lo de no máximo 1 milhão de linhas para satisfazer 85% das consultas, divididas em cerca de 8 a 10 tabelas de fatos com cerca de 4 ou 5 tabelas de dimensão.

Com tudo isso dito e feito, como mencionado, estou em uma posição muito afortunada, onde agora posso escolher a tecnologia que é usada para o back-end do armazém. Eu nunca tive a oportunidade de realmente me envolver no SSAS e sentir que é uma tecnologia que me falta. O SSAS ainda é uma escolha popular para Data Warehouses ou sua popularidade diminuiu nos últimos anos? Ainda é usado tanto quanto há 5 anos?

VERSÃO CURTA: O SSAS ainda é algo que vale a pena aprender/investir tempo e esforço?

Estamos atualmente no SQL 2016 e isso será construído no SQL Server 2017

Obrigado por todas as suas contribuições.

sql-server sql-server-2016
  • 1 1 respostas
  • 796 Views

1 respostas

  • Voted
  1. Best Answer
    World Wide DBA
    2019-05-23T13:41:45+08:002019-05-23T13:41:45+08:00

    Na minha opinião, sim - ainda é uma tecnologia totalmente válida. Ainda mais se estivermos discutindo implementações de SSAS tabulares em vez de multidimensionais. Por exemplo, o VertiPaq (o mecanismo de banco de dados que executa o Tabular Models) é o mesmo mecanismo que pode ser encontrado no PowerBI e quaisquer habilidades que você aprender usando SSAS/TOM/DAX o ajudarão se você decidir aprender isso também. Também é bom notar que PowerBI, Excel, SSRS e muitas outras ferramentas podem se conectar ao SSAS/Tabular para obter dados para construir painéis e relatórios.

    Pessoalmente, uso SSAS/Tabular desde o início de 2014 e já implementei 3 implementações em larga escala (atualmente estou trabalhando na minha 4ª). Minha empresa atual usa SSAS/Tabular como o Analytics Engine para seu produto principal. Ele pode ser integrado a muitos outros produtos além do SQL Server usando o PowerQuery para obter dados de outras fontes .

    Se tudo o que você estava planejando fazer era ter um data warehouse com um esquema em estrela (ou mesmo esquema em floco de neve), o Tabular é uma boa escolha, pois oferece desempenho fantástico (dependente de hardware) e compactação incrível. Você deve estar ciente de que é um mecanismo de análise puramente na memória, portanto, se você optar por seguir esse caminho, esteja preparado para adquirir muita RAM. Para estimar a quantidade de RAM necessária, uma instalação Tabular típica terá 1/10 do tamanho dos dados de origem (sujeito a bons princípios de modelagem).

    Eu tenho um modelo tabular que contém cerca de 800 milhões de linhas de dados na tabela de fatos principal e cerca de 16 milhões de linhas em cada uma das tabelas de dimensão. Ele ocupa cerca de 48 GB de RAM, mas as consultas são de menos de um segundo ao aplicar um filtro e menos de 30 segundos ao despejar a tabela inteira. Ao contrário do SQL Server, o particionamento em um modelo tabular não acelera a consulta, pois os dados não estão no disco, mas acelera o processo de ETL, pois você pode carregar partições individuais.

    Com tudo isso dito, ainda tenho um data warehouse do SQL Server que armazena dados que não quero no meu modelo tabular. Como acontece com qualquer tecnologia, escolha a ferramenta certa para o trabalho. Se você deseja algo que possa fornecer análises de alto desempenho, o Tabular é uma ótima opção, mas exige que você aprenda mais algumas tecnologias (C# e PowerShell são essenciais na minha opinião, pois ajudam na implantação, gerenciamento e compilações). No entanto, se você não tiver o orçamento, os recursos ou a necessidade dos recursos que uma instalação Tabular oferece, um data warehouse tradicional ou uma instalação SSAS multidimensional pode ser o melhor caminho a seguir.

    • 3

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve