我正在合作部署,旨在为学习和教学目的提供 Hadoop、Hive 和 Impala。我们在虚拟机上使用 Ubuntu 22.04 作为基础系统。
虽然与 HDFS、Hadoop 和 Hive 相关的一切都运行良好(包括用于 Hive Metastore 的 PostgreSQL),但 Impala 的安装却是一项非常艰巨的挑战。我应用了Apache 文档中推荐的命令来构建 Impala,然后运行make install
。
构建后,当尝试运行catalogd
服务时,它无法启动,并记录以下内容:
cat /tmp/catalogd.pc.hadoop.log.ERROR.20250311-114741.4782
Log file created at: 2025/03/11 11:47:41
Running on machine: pc
Log line format: [IWEF]mmdd hh:mm:ss.uuuuuu threadid file:line] msg
E0311 11:47:41.450573 4782 logging.cc:256] stderr will be logged to this file.
E0311 11:48:10.130164 4782 catalog.cc:101] NoSuchMethodError: org.apache.hadoop.hive.metastore.IMetaStoreClient.getThriftClient()Lorg/apache/hadoop/hive/metastore/api/ThriftHiveMetastore$Client;
. Impalad exiting.
Picked up JAVA_TOOL_OPTIONS: -Dsun.java.command=catalogd
statestored
并且admissiond
正在工作。
使用 Impala 提交 34b17db7b473d6729ac6c9cf139fcf410f18d941 和预构建的 Hive 4.0.1。