我想知道这个问题还没有被问到。谷歌对我来说只有很少的结果没有显示高质量的工具
数据仓库,更具体地说是商业智能工具有哪些开源(也可以免费)解决方案?你和他们有什么经验。我在我的硕士课程中有一门课程,我们使用 MS 商业智能和 MSSQL 作为数据仓库存储。现在我想用“开放”的工具来深入探讨这个话题。
是否有任何可比较的商业智能工具(主要是独立于数据库),您是否有使用它们的经验?
编辑玛丽安对斯蒂芬妮的回答的评论,我发现我提出的问题是错误的。我知道 DWH 只是“报告优化”的数据库,Stephanie 对此的解释非常清楚。我更感兴趣的是如何使用什么样的 BI 软件/工具/其他技术将数据转化为这种优化的形式。
我已经与 Pentaho 合作了大约一年。
Pentaho 是一个完整的商业智能开源套件。
它的优势在于它依赖于独立管理的项目:
您可以将它们作为一个整体(Pentaho BI Server)或分开使用。
为什么我会推荐它?社区非常活跃,每周都会提供插件。一组社区成员提供了一个框架,用于使用 click&go ui 构建交互式仪表板。
它独立于数据库。如果你有一些空闲时间就看看它。
在使用 Pentaho 之前我进行了一项研究,我测试了 IceCube 和 Palo 甚至 JasperSoft,但根据我的需要,Pentaho 的性能要好得多。
我认为您不了解datawarehouse的含义。它不是工具。或者一个应用程序。或者数据库。这并不意味着“大数据库”。
你说,
MSSQL 不仅仅是 DWH 的存储,它还是DWH。
数据仓库是专门为报告而设计和优化的数据库。您不会针对它进行交易。
您可以针对该 DWH 使用几乎任何 BI 工具。但 BI 工具不是 DWH。
可以使用任何 RDBMS。有些人会在管理规模方面做得更好。分区和星型连接是 RDBMS 中的特性示例,它们可以改进非常大的数据仓库,但它们不是必需的。
多维数据集通常源自数据仓库,用于沿各个维度快速切分各个级别的聚合。
使用您想要的任何 RDBMS。理解维度建模才是真正的讨论。