Il n'y a rien dans le framework .NET qui vous aidera avec ça immédiatement.
Les fautes d'orthographe les plus courantes sont celles où les lettres sont une représentation phonétique correcte du mot, mais pas l'orthographe correcte du mot.
Par exemple, on pourrait argumenter que les mots épée
et épeé
(oui, c'est un mot) ont les mêmes racines phonétiques (ils sonnent pareil quand vous les prononcez).
Cela dit, il existe plusieurs algorithmes que vous pouvez utiliser pour traduire des mots (même mal orthographiés) en variantes phonétiques.
Le premier est Soundex. Il est assez simple à implémenter et il existe un bon nombre d'implémentations .NET de cet algorithme. C'est plutôt simple, mais cela vous donne des valeurs réelles que vous pouvez comparer entre elles.
Un autre est Metaphone. Bien que je ne puisse pas trouver une implémentation native .NET de Metaphone, le lien fourni renvoie vers plusieurs autres implémentations qui pourraient être converties. La plus facile à convertir serait probablement l' implémentation Java de l'algorithme Metaphone.
Il convient de noter que l'algorithme Metaphone a été révisé. Il y a Double Metaphone (qui dispose d'une implémentation .NET) et Metaphone 3. Metaphone 3 est une application commerciale, mais a un taux de précision de 98% comparé à un taux de précision de 89% pour l'algorithme Double Metaphone lorsqu'il est exécuté sur une base de données de mots anglais courants. Selon vos besoins, vous pourriez vouloir rechercher (dans le cas de Double Metaphone) ou acheter (dans le cas de Metaphone 3) la source de l'algorithme et la convertir ou y accéder via la couche P/Invoke (il existe de nombreuses implémentations en C++).
Metaphone et Soundex diffèrent en ce sens que Soundex produit des clés numériques de longueur fixe, tandis que Metaphone produit des clés de longueurs différentes, donc les résultats seront différents. Au final, les deux feront le même type de comparaison pour vous, vous devez juste déterminer celui qui convient le mieux à vos besoins, en fonction de vos exigences et de vos ressources (et de votre tolérance aux fautes d'orthographe, bien sûr).