Supposons que vous ayez un DAG de flux d'air qui n'a pas de sens pour le remblayage, ce qui signifie qu'après l'avoir exécuté une fois, l'exécuter plusieurs fois rapidement serait complètement inutile.
Par exemple, si vous chargez dans votre base de données des données provenant d'une source qui n'est mise à jour que toutes les heures, le backfilling, qui se produit en succession rapide, reviendrait à importer les mêmes données encore et encore.
C'est particulièrement ennuyeux lorsque vous instanciez une nouvelle tâche horaire, et qu'elle exécute N
le nombre de fois par heure qu'il a manqué, en faisant du travail redondant, avant qu'il ne commence à fonctionner à l'intervalle que vous avez spécifié.
La seule solution à laquelle je peux penser est quelque chose qu'ils ont spécifiquement déconseillé dans FAQ de la docs
Il est déconseillé d'utiliser des valeurs dynamiques comme date de début, en particulier dans les cas suivants
datetime.now()
car cela peut être assez déroutant.
Existe-t-il un moyen de désactiver le backfilling pour un DAG, ou dois-je faire ce qui précède ?