Voici mon échantillon de données dans un fichier txt :
1322484979.322313000 85.24.168.19 QQlb-j7itDQ
1322484981.070116000 83.233.56.133 Ne8Bb1d5oyc
1322484981.128791000 83.233.56.133 Ne8Bb1d5oyc
1322484981.431075000 83.233.56.133 Ne8Bb1d5oyc
1322484985.210652000 83.233.57.136 QWUiCAE4E7U
La première colonne est l'horodatage, la deuxième colonne est l'adresse IP, la troisième est une valeur de hachage.
Je veux vérifier si deux ou plusieurs lignes successives ont la même adresse IP et la même valeur de hachage, je dois utiliser le dernier horodatage de la ligne dupliquée pour soustraire le premier horodatage de la ligne dupliquée, dans ce cas, c'est 132248981.431075000-1322484981.070116000.
Si le résultat est inférieur à 5, je ne conserverai que la première ligne (la plus ancienne) du fichier.
Si le résultat est supérieur à 5, je vais garder la première et la dernière ligne dupliquée, et supprimer les lignes entre elles.
Comme je suis un débutant en python, ce problème est un peu compliqué pour moi. Je ne sais pas quel type de fonction est nécessaire, quelqu'un peut-il m'aider un peu ?