J'ai téléchargé un fichier Wikipedia et je veux convertir le format wiki dans mon format objet. Existe-t-il un analyseur de wiki qui convertit l'objet en XML ?
Réponse
Trop de publicités?Vous pouvez essayer wikiprep qui est un analyseur perl de wikipedia. consulter sa page
Il produit de nombreux fichiers, dont certains sont
1- wikipedia analysé en XML 2- fichier cat-hier , qui contient la hiérarchie des catégories de wikipedia
je l'ai essayé et il est très utile le seul problème est qu'il a besoin d'une grande mémoire disponible pour le traitement, probablement plus de 4gb RAM vous pouvez également télécharger une version XML préparée à l'avance à l'adresse suivante aquí qui est également disponible sur la page
- Réponses précédentes
- Plus de réponses