AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 121739
Accepted
Mathieu Guindon
Mathieu Guindon
Asked: 2015-11-21 14:18:17 +0800 CST2015-11-21 14:18:17 +0800 CST 2015-11-21 14:18:17 +0800 CST

Como faço para criar um nível hierárquico "pai" anulável?

  • 772

Estou configurando meu primeiro banco de dados dimensional com SSAS e tenho essa dimensão [Materials] que precisa de uma hierarquia mais ou menos assim:

[PriceCode    v] --> nullable
  Price Code
  ...
[Material     v]
  Code
  AltCode
  Name
  ...
[Id           v]  --> not actually exposed as a hierarchy level
  DateInserted
  DateUpdated
  DateDeleted
  EffectiveFrom
  EffectiveTo

O problema é que o [PriceCode]atributo pode ser anulado; o DSV tem um FK entre ae [Materials]uma [PriceCodes]tabela e [Materials].[PriceCodeId]é anulável.

Existe uma maneira de ainda definir uma hierarquia em que um atributo anulável é um pai? Eu brinquei com UnkownMember e UnknownMemberName e a configuração NullProcessing da chave de atributo , mas não consegui processar a dimensão.

Pontos de bônus se alguém puder confirmar se estou abordando corretamente o problema da dimensão de mudança lenta, criando um nível de hierarquia com base nas chaves de negócios (ou seja, o Codecampo; a chave natural inclui o EffectiveTocampo, que é nullpara a imagem atual de um registro), e tratando os metadados SCD como um nível próprio.

sql-server ssas
  • 1 1 respostas
  • 518 Views

1 respostas

  • Voted
  1. Best Answer
    Tom V
    2015-11-22T08:14:09+08:002015-11-22T08:14:09+08:00

    Na verdade, você tem 2 perguntas em uma pergunta. Se você criar uma nova pergunta para os atributos, seria mais organizado e cortarei/colarei metade disso como resposta lá :)

    Nível pai anulável

    Você provavelmente não quer NULLs em suas dimensões OLAP, e Kimball parece concordar .

    Nulos também devem ser evitados quando não podemos fornecer um valor para um atributo de dimensão em uma linha de dimensão válida. Existem vários motivos pelos quais o valor de um atributo de dimensão pode não estar disponível:

    Missing Value – The attribute was missing from the source data.
    Not Happened Yet – The attribute is not yet available due to source system timing issues.
    Domain Violation – Either we have a data quality issue, or we don’t understand all the business rules surrounding the attribute. The data provided by the source system is invalid for the column type or outside the list of valid domain values.
    Not Applicable – The attribute is not valid for the dimension row in question.
    

    Depende se você tem um ETLprocesso e um Data Warehouse ou não, como você deve lidar com eles, mas existem diferentes tipos de 'não encontrado'.

    Pense na diferença em uma chave estrangeira, uma tem um campo vazio, outra tem um campo preenchido, mas o registro relacionado não pode (ou não pode mais) ser encontrado. Gosto de diferenciar entre BLANKe DATA ERRORna minha dimensão.

    No seu exemplo, você poderia diferenciar entre 'sem código de preço' e 'um código de preço que não consigo mais encontrar'

    Se você tiver um ETLprocesso com um Data Warehouse, poderá lidar com isso facilmente em seu ETLprocesso; caso contrário, precisará de algumas instruções de caso em suas consultas DSV.

    Esta questão parece revelar problemas com o Data Warehouse subjacente. Existem argumentos a favor e contra os esquemas de estrela e floco de neve, mas pessoalmente eu tendo um esquema de estrela, com um pouco de floco de neve misturado quando necessário.
    Em qualquer caso, a limpeza de dados e os links ausentes precisam ser resolvidos em seu Data Warehouse muito antes de você chegar ao dsv.

    Atributos de dimensão de alteração lenta

    Com relação ao seu Slowly Changing Dimension, não vejo como o tipo de dados de hierarquias ou chaves em sua dimensão mudaria porque a dimensão de alguma forma é SCD, isso não importa. Você só precisa de uma regra de validade em algum lugar em seu ETL que seja selecionada por sua definição de dimensão SSAS ( veja aqui ). Mas, para qualquer um dimension keyque você criar, sugiro que você use uma chave substituta principalmente porque sua chave substituta pode ser um intou bigintem vez de um varchar e isso pode melhorar enormemente o desempenho , mesmo para chaves de atributo.

    O uso de uma coluna de chave numérica em vez de uma coluna de chave de string ou uma chave composta melhorará o desempenho de atributos que contêm muitos membros. Essa prática recomendada é baseada no mesmo conceito de usar chaves substitutas em tabelas relacionais para uma indexação mais eficiente. Você pode especificar a coluna substituta numérica como a coluna-chave e ainda usar uma coluna de string como a coluna de nome para que os membros do atributo pareçam os mesmos para os usuários finais. Como diretriz, se o atributo tiver mais de um milhão de membros, considere o uso de uma chave numérica.

    É claro que essa chave numérica seria uma representação do 'atributo' e não incluiria necessariamente os campos de validade. A validade do registro é especificada no registro em sua tabela de dimensões, mas como você afirma não é necessário para suas chaves de atributo.

    Por exemplo, estes podem ser seus dados de dimensão

    +---------------+-------+-----------+----------+
    | DIMENSION_KEY |  NAME |  NAME_KEY |  CURRENT |
    +---------------+-------+-----------+----------+
    | 1             | tom   | 1         | y        |
    | 2             | mat   | 2         | n        |
    | 3             | mat   | 2         | y        |
    +---------------+-------+-----------+----------+
    

    Onde você pode escolher dimension_key para a chave do seu key attributee pode escolher name ou name_key como a chave do seu nameatributo.

    Determinar se vale a pena o aborrecimento namedepende de quantos membros seu atributo terá (e seu atributo de chave normalmente tem a maioria dos membros).

    No final, não há realmente nenhuma relação entre o fato de você ter um SCDe sua decisão de qual chave é uma boa escolha para seu atributo. Os requisitos do usuário final tomam essa decisão por você. Na dimensão de exemplo, você desejaria que todas as vendas por esteira fossem relatadas sob esteira e não tivesse 2 esteiras em seus membros quando os usuários relatassem isso.

    • 3

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve