13 votes

Analyseur pour Wikipedia

J'ai téléchargé un fichier Wikipedia et je veux convertir le format wiki dans mon format objet. Existe-t-il un analyseur de wiki qui convertit l'objet en XML ?

-1voto

Hady Elsahar Points 835

Vous pouvez essayer wikiprep qui est un analyseur perl de wikipedia. consulter sa page

Il produit de nombreux fichiers, dont certains sont

1- wikipedia analysé en XML 2- fichier cat-hier , qui contient la hiérarchie des catégories de wikipedia

je l'ai essayé et il est très utile le seul problème est qu'il a besoin d'une grande mémoire disponible pour le traitement, probablement plus de 4gb RAM vous pouvez également télécharger une version XML préparée à l'avance à l'adresse suivante aquí qui est également disponible sur la page

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X