Eu me pergunto se essa pergunta ainda não foi feita. O Google tem poucos resultados para mim que não mostram uma ferramenta de alta qualidade
Quais são algumas soluções Open Source (também gratuitas) para Data Warehouses e mais especificamente Ferramentas de Business Intelligence? Quais são suas experiências com eles. Fiz um curso no meu programa de mestrado e trabalhamos com MS Business Intelligence e MSSQL como armazenamento de Data Warehouse. Agora eu quero entrar mais neste tópico com ferramentas que são "abertas".
Existem ferramentas comparáveis para Business Intelligence (principalmente independentes de banco de dados) e você tem alguma experiência com elas?
editar Com o comentário de Marian à resposta de Stephanie, vejo que formulei a pergunta errada. Estou ciente de que DWH são apenas bancos de dados "otimizados para relatórios", a explicação de Stephanie foi muito clara sobre isso. Estou mais interessado em como obter os dados em formas otimizadas com QUE tipo de software/ferramentas/outras técnicas de BI.
Trabalho com a Pentaho há cerca de um ano.
Pentaho é um pacote Open Source completo para Business Intelligence.
Sua força é que ele depende de um projeto gerenciado de forma independente:
Você pode usá-los como um todo (Pentaho BI Server) ou separados.
Por que eu o recomendaria? A comunidade é muito ativa e fornece plugins semanalmente. Um grupo de membros da comunidade forneceu uma estrutura para criar um painel interativo com uma interface de usuário click&go.
É independente de banco de dados. Se você tiver algum tempo livre, dê uma olhada.
Pesquisei antes de usar o Pentaho, testei IceCube e Palo até JasperSoft mas o Pentaho foi de longe melhor de acordo com minhas necessidades.
Acho que você não está entendendo o que significa datawarehouse . Não é uma ferramenta. Ou um aplicativo. Ou um banco de dados. Não significa "grande banco de dados".
Você disse,
O MSSQL não era apenas o armazenamento para o DWH, é o DWH.
Um datawarehouse é um banco de dados especificamente projetado e otimizado para geração de relatórios. Você não registra transações contra ele.
Você pode usar praticamente qualquer ferramenta de BI contra esse DWH. Mas a ferramenta de BI não é o DWH.
Qualquer RDBMS pode ser usado. Alguns farão um trabalho melhor gerenciando o tamanho. Particionamento e Star Joins são exemplos de recursos em um RDBMS que melhoram datawarehouses muito grandes, mas não são necessários.
Os cubos geralmente são derivados de um datawarehouse e são usados para dividir rapidamente vários níveis de agregação ao longo de várias dimensões.
Use qualquer RDBMS que desejar. Compreender a modelagem dimensional é a verdadeira discussão.