134 votes

Où puis-je télécharger la base de données des dictionnaires anglais en format texte ?

Je dois lire le fichier texte à la recherche d'un mot et renvoyer sa signification. Tout autre format de fichier fonctionnera également.

2 votes

J'ai écrit un clawler web pour tous les dictionnaires en ligne célèbres (Oxford, Longman, Cambridge, Webster, et Collins) vous pouvez l'utiliser pour faire votre datset. github.com/kiasar/Dictionary_crawler

0 votes

J'ai trouvé une base de données de dictionnaires gratuits : github.com/eddydn/DictionaryDatabase

63voto

Asaph Points 56989

El Le Projet Gutenberg héberge le dictionnaire anglais non abrégé de Webster. ainsi que de nombreuses autres œuvres littéraires du domaine public. En fait, il semble qu'ils ont plusieurs versions du dictionnaire hébergées avec des droits d'auteur de différentes années. Celui que j'ai mis en lien a un copyright de 2009. Vous pouvez vous promener sur le site et examiner les différentes versions du dictionnaire Webster.

1 votes

La transcription nettoyée de la version de 1913, apparemment l'OCR n'était pas complètement propre. Il y a un total de 15 versions sur le site.

0 votes

Je ne peux pas y accéder. Il semble que le site Web ou mon IP soit bloqué.

0 votes

Ce dictionnaire n'inclut pas les formes plurielles des mots, mais elles peuvent être incluses avec le module Inflect pour python 3.

57voto

Orwellophile Points 2695

User1247808 a un bon lien avec : wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Si ce n'est pas assez de mots pour vous :

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (url mis à jour à partir de la suggestion de Michael Kropat)

Bien que le nom de ce fichier change, vous voudrez trouver le dernier ... qui s'avère n'être qu'un gros (très gros) fichier texte.

http://dumps.wikimedia.org/enwiktionary/

0 votes

Merci pour ce lien

0 votes

Vous pouvez toujours télécharger la dernière version du wiktionnaire à partir du site suivant dumps.wikimedia.org/enwiktionary/latest/

0 votes

Androidtech/wordnet20 est au format SQL et non txt.

28voto

user1247808 Points 126

Je ne sais pas si c'est trop tard, mais j'ai pensé que ça pourrait aider quelqu'un d'autre.

Je voulais absolument la même chose... et j'ai fini par la trouver.

Il n'est peut-être pas parfait, mais pour moi, il est adéquat (pour mon petit dictionnaire).

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Ce n'est pas un fichier de vidage, mais un fichier MYSQL .sql script.

Les mots sont dans la table WN_SYNSET et le glossaire/signification dans la table WN_GLOSS.

4 votes

Sous quelle licence ?

2 votes

Je ne suis pas sûr aussi, mais à androidtech.com/html/downloads.php il y a Here are some files related to natural language and chatterbot projects that we are making available to the public

7 votes

Utilisateurs de MySQL : les instructions de création de table utilisent l'option TYPE, désormais supprimée. Exécutez ceci sur le fichier sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sql pour le faire fonctionner dans la dernière version de MySQL

15voto

mvark Points 773

Vérifiez si ces ressources gratuites répondent à vos besoins -

8 votes

FOLDOC (Free On-line Dictionary of Computing) semble être un dictionnaire de termes/noms informatiques uniquement. Il peut être utile pour certains, mais ce n'est pas un dictionnaire général dans lequel vous pouvez chercher la plupart des mots.

2 votes

Le lien de la page ObjectGraph est également mort. Les versions officielles téléchargeables sont situées aquí .

0 votes

@Lèsemajesté votre lien est aussi mort maintenant

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X