Dans le cadre d'une application Web basée sur Java, je vais accepter des fichiers .xls et .csv (et éventuellement d'autres types) téléchargés. Chaque fichier sera renommé de manière unique avec une combinaison de paramètres et un horodatage.
J'aimerais être capable d'identifier les fichiers en double. Par doublon, j'entends le même fichier, quel que soit son nom. Idéalement, j'aimerais pouvoir détecter les doublons aussi rapidement que possible après le téléchargement, de sorte que le serveur puisse inclure cette information dans la réponse. (Si le temps de traitement par taille de fichier ne provoque pas un décalage trop important).
J'ai lu qu'il était possible d'exécuter un MD5 sur les fichiers et de stocker le résultat sous forme de clés uniques, etc... mais j'ai le sentiment qu'il y a un meilleur moyen. (Y a-t-il un meilleur moyen ?)
Tout conseil sur la meilleure façon d'aborder cette question sera apprécié.
Merci.
UPDATE : Je n'ai absolument rien contre l'utilisation du MD5. Je l'ai utilisé à quelques reprises dans le passé avec Perl ( Digest::MD5 ). Je pensais que dans le monde Java, un autre ( meilleur ), une solution aurait pu émerger. Mais, il semble que je me sois trompé.
Merci à tous pour les réponses et les commentaires. Je me sens assez bien pour utiliser MD5 maintenant.