Estou colaborando em uma implantação que visa fornecer Hadoop, Hive e Impala para fins de aprendizado e ensino. Usamos o Ubuntu 22.04 como sistema base em uma VM.
Enquanto tudo relacionado ao HDFS, Hadoop e Hive está funcionando bem (incluindo PostgreSQL para Hive Metastore), a instalação do Impala está sendo um desafio muito difícil. Eu apliquei os comandos recomendados na Documentação do Apache para construir o Impala, e então executei make install
.
Após a construção, ao tentar executar catalogd
o serviço, ele não inicia, registrando o seguinte:
cat /tmp/catalogd.pc.hadoop.log.ERROR.20250311-114741.4782
Log file created at: 2025/03/11 11:47:41
Running on machine: pc
Log line format: [IWEF]mmdd hh:mm:ss.uuuuuu threadid file:line] msg
E0311 11:47:41.450573 4782 logging.cc:256] stderr will be logged to this file.
E0311 11:48:10.130164 4782 catalog.cc:101] NoSuchMethodError: org.apache.hadoop.hive.metastore.IMetaStoreClient.getThriftClient()Lorg/apache/hadoop/hive/metastore/api/ThriftHiveMetastore$Client;
. Impalad exiting.
Picked up JAVA_TOOL_OPTIONS: -Dsun.java.command=catalogd
statestored
e admissiond
estão trabalhando.
Usando o commit 34b17db7b473d6729ac6c9cf139fcf410f18d941 do Impala e o Hive 4.0.1 pré-compilado.