Je veux avoir un modèle de chargement incrémentiel pour un système source où il n'y a pas de champs d'audit qui indiquent quand l'enregistrement a été modifié pour la dernière fois. Exemple : Dernière modification le (date et heure)
Mais ces tables sont définies avec des clés primaires et des clés uniques qui sont utilisées par l'application pour mettre à jour l'enregistrement lorsqu'il y a un changement dans l'attribut.
Maintenant, la question est de savoir comment je peux déterminer les deltas chaque jour et les charger dans Azure Data Lake en utilisant Azure Data Factory / Databricks.
Dois-je mettre en scène l'ensemble des données de la journée actuelle et de la journée actuelle -1 et déterminer les deltas en utilisant des valeurs de hachage ?
Ou y a-t-il un meilleur moyen ?