Comme nous le savons tous, les nombres peuvent être écrits soit en chiffres, soit appelés par leur nom. Alors qu'il existe de nombreux exemples pour convertir 123 en cent vingt-trois, je n'ai pas trouvé de bons exemples pour convertir l'inverse.
Quelques mises en garde :
- cardinal/nominal ou ordinal : "un" et "premier"
- les fautes d'orthographe courantes : "forty"/"fourty"
- centaines/milliers : 2100 -> "vingt et cent" et aussi "deux mille et cent".
- séparateurs : "onze cent cinquante deux", mais aussi "onze cent cinquante-deux" ou "onze cent cinquante-deux", etc.
- les expressions familières : "la trentaine"
- des fractions : un tiers, deux cinquièmes
- Noms communs : "une douzaine", "la moitié".
Et il existe probablement d'autres réserves possibles qui ne sont pas encore répertoriées. Supposons que l'algorithme doive être très robuste, et même comprendre les fautes d'orthographe.
Quels domaines/articles/études/algorithmes dois-je lire pour apprendre à écrire tout cela ? Où se trouvent les informations ?
PS : Mon analyseur final devrait comprendre 3 langues différentes, l'anglais, le russe et l'hébreu. Et peut-être qu'à un stade ultérieur, d'autres langues seront ajoutées. L'hébreu a aussi des nombres masculins/féminins, comme "un homme" et "une femme" ont un "un" différent - "ehad" et "ahat". Le russe présente également certaines de ses propres complexités.
Google fait un excellent travail dans ce domaine. Par exemple :
http://www.google.com/search?q=two+mille+un+cents+plus+cinq+douze+et+quatre+cinquièmes+en+décimal
(l'inverse est également possible http://www.google.com/search?q=999999999999+en+francais )
0 votes
Cela ne s'applique peut-être pas autant aux recettes, mais n'oubliez pas les mots comme score, décennie, siècle, etc. Similaire à douzaine, brut, moitié comme vous l'avez déjà noté.
0 votes
"fourty" n'est pas un mot dans aucune variante de l'anglais ! L'OED a quelques mentions de l'orthographe "fourty", mais elles datent de 1707 ou avant.
2 votes
Même si "quarante" n'est pas un mot, les gens le confondent souvent avec un mot. Et je dois analyser ce que les gens écrivent, pas les mots "appropriés".
0 votes
Il semblerait qu'avoir une seule façon de dire un nombre (comme dans "one" en anglais) soit l'exception, plutôt que la règle. Le français a "un" et "une" ; et l'allemand a au moins 3 façons différentes de dire 1 ("eins", "eine" et "einen" si ma mémoire est bonne).
0 votes
@RobH Avertissement de pédanterie ! !! "Eine" et "Einen" sont des articles indéfinis (pensez à "a" ou "an") et non le nombre entier ("un"). :-)
0 votes
A quoi doit-on évaluer la "trentaine" ?