J'imagine que la méthode la plus évolutive serait de stocker une empreinte digitale avec chaque image. Ensuite, lorsqu'une nouvelle image est ajoutée, il suffit d'utiliser la commande suivante SELECT id FROM photos where id='uploaded_image_id'
pour vérifier les doublons (ou prendre les empreintes digitales de toutes les images, puis effectuer une recherche de doublons).
Évidemment, un simple fichier de hachage ne fonctionnerait pas car le contenu réel diffère
Empreintes acoustiques / cet article peut être un bon début pour le concept, car il existe de nombreuses implémentations de celui-ci. Ici est un article sur les empreintes digitales des images.
Cela dit, vous pouvez peut-être vous en sortir avec quelque chose de plus simple. Quelque chose d'aussi basique que de redimensionner l'image pour qu'elle soit de même largeur ou hauteur, de soustraire image_a
de image_b
et en additionnant la différence. Si la différence totale est inférieure à un seuil, l'image est un duplicata.
Le problème est que vous devez comparer chaque image à une autre. Le temps nécessaire va augmenter de façon exponentielle..