2 votes

Spark-HBase - Modèle GCP (3/3) - Bibliothèques manquantes?

Je teste le connecteur Spark-HBase dans le contexte GCP et j'ai essayé de suivre les instructions, qui demandent d'empaqueter localement le connecteur, et je reçois l'erreur suivante lors de la soumission du job sur Dataproc (après avoir terminé ces étapes).

Commande

(base) gcloud dataproc jobs submit spark --cluster $SPARK_CLUSTER --class com.example.bigtable.spark.shc.BigtableSource --jars target/scala-2.11/cloud-bigtable-dataproc-spark-shc-assembly-0.1.jar --region us-east1 -- $BIGTABLE_TABLE

Erreur

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration

1voto

py-r Points 325

J'ai trouvé un moyen de travail, en ajoutant les dépendances suivantes dans build.sbt - merci @jccampanero pour l'orientation !

libraryDependencies += "org.apache.hbase" % "hbase-common" % "2.0.2"
libraryDependencies += "org.apache.hbase" % "hbase-mapreduce" % "2.0.2"

Sortie (Bigtablesource.scala)

+------+-----+----+----+
|  col0| col1|col2|col3|
+------+-----+----+----+
|row000| true| 0.0|   0|
|row001|false| 1.0|   1|
|row002| true| 2.0|   2|
|row003|false| 3.0|   3|
|row004| true| 4.0|   4|
|row005|false| 5.0|   5|
|row006| true| 6.0|   6|
|row007|false| 7.0|   7|
|row008| true| 8.0|   8|
|row009|false| 9.0|   9|
|row010| true|10.0|  10|
|row011|false|11.0|  11|
|row012| true|12.0|  12|
|row013|false|13.0|  13|
|row014| true|14.0|  14|
|row015|false|15.0|  15|
|row016| true|16.0|  16|
|row017|false|17.0|  17|
|row018| true|18.0|  18|
|row019|false|19.0|  19|
+------+-----+----+----+
only showing top 20 rows

+------+-----+
|  col0| col1|
+------+-----+
|row000| true|
|row001|false|
|row002| true|
|row003|false|
|row004| true|
|row005|false|
+------+-----+

+------+-----+
|  col0| col1|
+------+-----+
|row000| true|
|row001|false|
|row002| true|
|row003|false|
|row004| true|
|row005|false|
+------+-----+

+------+-----+
|  col0| col1|
+------+-----+
|row251|false|
|row252| true|
|row253|false|
|row254| true|
|row255|false|
+------+-----+

+-----------+
|count(col1)|
+-----------+
|         50|
+-----------+

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X