Voici l'explication directement de la source ( presque )
à min 22:03
Ça vaut le coup de regarder !
En gros, et selon Douglas Merrill, ancien directeur technique de Google, c'est comme ça :
1) Vous écrivez un mot (mal orthographié) dans Google.
2) Vous ne trouvez pas ce que vous cherchez ( ne cliquez sur aucun résultat )
3) Vous vous rendez compte que vous avez mal orthographié le mot et vous le réécrivez dans le champ de recherche.
4) Vous trouvez ce que vous voulez (vous cliquez sur les premiers liens).
Ce schéma, multiplié des millions de fois, montre quelles sont les fautes d'orthographe les plus fréquentes et quelles sont les corrections les plus "courantes".
De cette façon, Google peut presque instantanément proposer une correction orthographique dans toutes les langues.
Cela signifie également que si, du jour au lendemain, tout le monde commence à épeler "nuit" comme "nigth", Google proposera ce mot à la place.
EDIT
@ThomasRutter : Douglas le décrit comme "l'apprentissage statistique des machines".
Ils savent qui a corrigé la requête, car ils savent quelle requête provient de quel utilisateur (en utilisant les cookies).
Si les utilisateurs effectuent une requête, que seuls 10 % d'entre eux cliquent sur un résultat et que 90 % reviennent et tapent une autre requête (avec le mot corrigé) et que, cette fois, ces 90 % cliquent sur un résultat, ils savent qu'ils ont trouvé une correction.
Ils peuvent également savoir s'il s'agit de requêtes "connexes" ou de deux requêtes différentes, car ils disposent d'informations sur tous les liens qu'ils affichent.
De plus, ils incluent désormais le contexte dans le correcteur orthographique, de sorte qu'ils peuvent même suggérer des mots différents en fonction du contexte.
Voir ceci démo de google wave ( @ 44m 06s ) qui montre comment le contexte est pris en compte pour corriger automatiquement l'orthographe.
Aquí il est expliqué comment fonctionne ce traitement du langage naturel.
Enfin, voici une démonstration impressionnante de ce que l'on peut faire en ajoutant des fonctions automatiques. traduction automatique ( @ 1h 12m 47s ) au mélange.
J'ai ajouté des ancres de minutes et de secondes aux vidéos pour passer directement au contenu. Si elles ne fonctionnent pas, essayez de recharger la page ou de faire défiler la page à la main jusqu'à la marque.
1 votes
Aquí est la version VB.NET du correcteur orthographique Norvig. Vous pourrez peut-être le trouver utile, s'il n'est pas trop tard !
7 votes
Duplicata possible de Comment mettre en place un "Vous voulez dire" ?
0 votes
Je tape sur un clavier non-qwerty (Colemak) et la fonction n'est pas aussi intelligente. Elle apprend sûrement à partir des paires de corrections d'erreurs enregistrées et est donc adaptée au qwerty. Les vérificateurs d'orthographe ordinaires fonctionnent bien sur mon clavier, comme prévu - la distance d'édition des chaînes est invariable selon la disposition.
2 votes
Je vote pour clore cette question parce que Les questions sur la théorie de l'apprentissage automatique (ML) sont hors sujet sur Stack Overflow - candidat à l'emballage cadeau pour le Cross-Validated