Je suis à la recherche d'un algorithme qui prend 2 cordes et va me donner un "facteur de similitude".
En gros, je vais avoir une entrée qui peut être mal orthographié, avoir des lettres transposées, etc, et je dois trouver la correspondance la plus proche(es) dans une liste de valeurs possibles que j'ai.
Ce n'est pas pour la recherche dans une base de données. Je vais avoir une liste en mémoire de 500 chaînes de match contre, tous les moins de 30 caractères, de sorte qu'il peut être relativement lente.
Je sais que cela existe, je l'ai vu avant, mais je ne me souviens pas de son nom.
Edit: Merci de remarquer Levenshtein et de Hamming. Maintenant, lequel dois-je mettre en œuvre? En gros, ils mesurent des choses différentes, qui peuvent tous deux être utilisés pour ce que je veux, mais je ne suis pas sûr que l'on est plus approprié.
J'ai lu sur les algorithmes, Hamming semble évidemment plus rapide. Depuis, ni de détecter les deux personnages étant transposée (ie. La jordanie et Jodran), qui sera à mon avis une erreur commune, qui sera plus précis pour ce que je veux? Quelqu'un peut-il m'en dire un peu plus sur les compromis?