Comment configurer un environnement virtuel ou installer une bibliothèque Python lorsque j'essaie de soumettre un travail PySpark à Databricks depuis Airflow ?

Question

Comment configurer un environnement virtuel ou installer une bibliothèque Python lorsque j'essaie de soumettre un travail PySpark à Databricks depuis Airflow ?

Demandé el 5 de Novembre, 2022: Quand la question a-t-elle été
17 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

Je dois soumettre une tâche PySpark à Airflow via LivyOperator. Je vois qu'il y a des arguments à la méthode d'initialisation de LivyOperator où les utilisateurs peuvent passer une liste de fichiers Python, mais y a-t-il un moyen de le faire de manière plus claire ? Par exemple, que faire si je souhaite installer une bibliothèque tierce ? Existe-t-il un moyen de configurer un environnement virtuel? Merci.

Demandé el 5 de Novembre, 2022 par WZH

Answer 1

1 Réponses

Answer 2

0voto

Alex Ott Points 14329

Pour exécuter des tâches sur Databricks, vous devez utiliser des opérateurs spécifiques à Databricks. Plus précisément, regardez le DatabricksSubmitRunOperator. Cet opérateur permet de spécifier les tâches à exécuter, ainsi que les bibliothèques requises pour ces tâches.

P.S. il n'y a vraiment pas suffisamment d'informations pour donner une réponse plus détaillée...

Répondu el 7 de Novembre, 2022 par Alex Ott (14329 Points )

Comment configurer un environnement virtuel ou installer une bibliothèque Python lorsque j'essaie de soumettre un travail PySpark à Databricks depuis Airflow ?

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment configurer un environnement virtuel ou installer une bibliothèque Python lorsque j'essaie de soumettre un travail PySpark à Databricks depuis Airflow ?

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: