Erick Ramirez Asked: 2022-12-08 04:11:50 +0800 CST2022-12-08 04:11:50 +0800 CST 2022-12-08 04:11:50 +0800 CST 我如何从 Pentaho Data Integration 连接到 Astra DB? 772 我想从Pentaho Data Integration(PDI 也称为“Spoon”,以前称为 KETTLE)连接到我的 Astra DB。如何配置 PDI? cassandra 1 个回答 Voted Best Answer Erick Ramirez 2022-12-08T04:11:50+08:002022-12-08T04:11:50+08:00 先决条件 本文假设您已经在笔记本电脑或 PC 上安装了Pentaho Data Integration 。它是为 MacOS 上的 9.1 版编写的,但这些说明也适用于 Windows 版的 PDI。 您还需要生成一个应用程序令牌并为您的 Astra DB下载安全包。 程序 JDBC 驱动程序 从 DataStax 网站下载 JDBC 驱动程序: 步骤 A1 - 转到https://downloads.datastax.com/#odbc-jdbc-drivers。 步骤 A2 - 选择适用于 Apache Cassandra 的 Simba JDBC 驱动程序。 步骤 A3 - 选择JDBC 4.2。 步骤 A4 - 阅读许可条款并接受(单击复选框)。 步骤 A5 - 点击蓝色的下载按钮。 步骤 A6 - 下载完成后,解压缩下载的文件。 导入驱动程序 使用分发工具将 Simba 驱动程序部署到 Pentaho 服务器: 步骤 B1 - 在您的笔记本电脑或 PC 上,将 Simba JAR 复制到 JDBC 分发目录: $ cp CassandraJDBC42.jar pentaho/jdbc-distribution/ 步骤 B2 - 运行分发工具(distribute-files.bat在 Windows 上): $ cd /Applications/Pentaho/jdbc-distribution $ ./distribute-files.sh CassandraJDBC42.jar 步骤 B3 - 验证 JAR 是否已复制到 PDI 库: $ cd /Applications/Pentaho $ ls -lh design-tools/data-integration/lib/CassandraJDBC42.jar -rw-r--r-- 1 erick vaxxed 16M 14 Sep 22:18 design-tools/data-integration/lib/CassandraJDBC42.jar $ file design-tools/data-integration/lib/CassandraJDBC42.jar design-tools/data-integration/lib/CassandraJDBC42.jar: Java archive data (JAR) 步骤 B4 - 在您的工作站上重新启动 Pentaho 以加载 Simba 驱动程序。 新连接 在 PDI 中连接到您的 Astra DB: 步骤 C1 - 创建一个新的转换。 步骤 C2 - 打开一个新的数据库连接对话框。 步骤 C3 - 在连接名称字段中,为您的数据库连接命名。 步骤 C4 - 在连接类型下,选择Generic database。 步骤 C5 - 将自定义连接 URL设置为: jdbc:cassandra://;AuthMech=2;TunableConsistency=6;SecureConnectionBundlePath=/path/to/secure-connect-getvaxxed.zip 请注意,您需要指定安全包的完整路径。 步骤 C6 - 将自定义驱动程序类名称字段设置为com.simba.cassandra.jdbc42.Driver。 步骤 C7 - 在用户名字段中,输入字符串token。步骤 C8 - 在密码字段中,粘贴您在上面的先决条件部分中创建的令牌的值。令牌值看起来像AstraCS:AbC...XYz:123...edf0。 步骤 C9 - 单击“测试连接”按钮以确认驱动程序配置正在运行: 步骤 C10 - 单击确定按钮以保存连接设置。 最后一个考试 通过在 Pentaho 中启动 SQL 编辑器并运行简单的 CQL 语句来连接到您的 Astra DB。例如: 这是一个示例输出: 您还应该能够使用 DataBase Explorer 浏览 Astra DB 中的键空间。这是一个示例输出: ? 请将鼠标悬停在cassandra上然后单击Watch tag按钮来支持 Apache Cassandra 社区。?谢谢!
先决条件
本文假设您已经在笔记本电脑或 PC 上安装了Pentaho Data Integration 。它是为 MacOS 上的 9.1 版编写的,但这些说明也适用于 Windows 版的 PDI。
您还需要生成一个应用程序令牌并为您的 Astra DB下载安全包。
程序
JDBC 驱动程序
从 DataStax 网站下载 JDBC 驱动程序:
步骤 A1 - 转到https://downloads.datastax.com/#odbc-jdbc-drivers。
步骤 A2 - 选择适用于 Apache Cassandra 的 Simba JDBC 驱动程序。
步骤 A3 - 选择JDBC 4.2。
步骤 A4 - 阅读许可条款并接受(单击复选框)。
步骤 A5 - 点击蓝色的下载按钮。
步骤 A6 - 下载完成后,解压缩下载的文件。
导入驱动程序
使用分发工具将 Simba 驱动程序部署到 Pentaho 服务器:
步骤 B1 - 在您的笔记本电脑或 PC 上,将 Simba JAR 复制到 JDBC 分发目录:
步骤 B2 - 运行分发工具(
distribute-files.bat
在 Windows 上):步骤 B3 - 验证 JAR 是否已复制到 PDI 库:
步骤 B4 - 在您的工作站上重新启动 Pentaho 以加载 Simba 驱动程序。
新连接
在 PDI 中连接到您的 Astra DB:
步骤 C1 - 创建一个新的转换。
步骤 C2 - 打开一个新的数据库连接对话框。
步骤 C3 - 在连接名称字段中,为您的数据库连接命名。
步骤 C4 - 在连接类型下,选择
Generic database
。步骤 C5 - 将自定义连接 URL设置为:
请注意,您需要指定安全包的完整路径。
步骤 C6 - 将自定义驱动程序类名称字段设置为
com.simba.cassandra.jdbc42.Driver
。步骤 C7 - 在用户名字段中,输入字符串
token
。步骤 C8 - 在密码字段中,粘贴您在上面的先决条件部分中创建的令牌的值。令牌值看起来像AstraCS:AbC...XYz:123...edf0
。步骤 C9 - 单击“测试连接”按钮以确认驱动程序配置正在运行:
步骤 C10 - 单击确定按钮以保存连接设置。
最后一个考试
通过在 Pentaho 中启动 SQL 编辑器并运行简单的 CQL 语句来连接到您的 Astra DB。例如:
这是一个示例输出:
您还应该能够使用 DataBase Explorer 浏览 Astra DB 中的键空间。这是一个示例输出:
? 请将鼠标悬停在cassandra上然后单击
Watch tag
按钮来支持 Apache Cassandra 社区。?谢谢!