Estou tentando criar um modelo dimensional para o seguinte:
Os dados de origem vêm de máquinas de jogos como mensagens do medidor. Basicamente, a máquina de jogo aceita pagamentos e envia um instantâneo dos valores atuais de várias medidas. A mensagem contém mais de 15 tipos de medidores, como nível de entrada de moedas (em centavos), nível de jogos disputados, jogos ganhos, jogos perdidos e assim por diante. Esta mensagem é captada diariamente. Devido ao fato de que os instantâneos dos níveis numéricos são obtidos diariamente, pensei que deveríamos usar uma tabela periódica de fatos instantâneos.
Seria melhor armazenar os níveis dos valores numéricos como medidas (ex. o valor total da entrada de moedas e o total de jogos jogados da máquina a partir do instantâneo) ou deveríamos armazenar o valor da contribuição para o período do instantâneo (ex $ 100 foi depositado e 10 jogos foram disputados em um dia). Ou talvez ambos os níveis e contribuições (os níveis não seriam aditivos na dimensão de data, mas as contribuições seriam)? Qual é a diferença em termos de análise.
Ainda não iniciamos a coleta de requisitos, mas parece que há muitos pedidos sobre a tendência dos dados de entrada de moedas, por exemplo, por mês por máquina.
Obrigado,
Armazenar os valores que se aplicam ao período do instantâneo seria o ajuste natural para a maioria dos tipos de relatório, incluindo "solicitações de tendência dos dados de moedas, por exemplo, por mês por máquina".
O risco é que, se um instantâneo for perdido, o total na máquina pode não corresponder aos totais no cubo. Armazenar ambos daria a você os meios para fazer uma verificação cruzada.