3 votes

Existe-t-il des algorithmes permettant de trouver la correspondance la plus proche d'une chaîne de caractères dans une collection de chaînes de caractères ?

Existe-t-il des algorithmes permettant de trouver la correspondance la plus proche d'une chaîne de caractères dans une collection de chaînes de caractères ? Par exemple :

string_to_match = 'What color is the sky?'

strings = [
  'What colour is the sea?', 
  'What colour is the sky?', 
  'What colour is grass?', 
  'What colour is earth?'
]

answer = method_using_string_matching_algorithm(string_to_match, strings)
answer # returns strings[1] 'What colour is the sky?'

4voto

CodeGnome Points 25402

Les termes de recherche que vous recherchez sont "algorithmes de distance entre chaînes de caractères" et "correspondance approximative entre chaînes de caractères". Une vérification rapide sur Google permet de trouver des options intéressantes telles que :

  • Distance Sift3
  • Distance de Levenshtein
  • Distance optimale d'alignement des chaînes
  • Distance Damerau-Levenshtein
  • Distance du clavier Qwerty

Voici quelques liens utiles :

À ce jour, les distributions Linux basées sur Debian comprennent également agrep et TRE-agrep dans leurs référentiels.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X