Faire fonctionner le ExtractingRequestHandler dans Solr

Question

Faire fonctionner le ExtractingRequestHandler dans Solr

Demandé el 27 de Octobre, 2011: Quand la question a-t-elle été
5413 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'essaie de faire fonctionner Solr avec Tika afin de pouvoir indexer des documents Word et PDF dans mon site Web Drupal.

J'ai regardé les Page du wiki y esto page et ils indiquent d'ajouter un requestHandler dans solrconfig.xml.

J'ai fait cela et maintenant Solr jette une exception :

org.apache.solr.common.SolrException : Erreur de chargement de la classe 'org.apache.solr.handler.extraction.ExtractingRequestHandler'.

J'ai fait quelques recherches et je vois que d'autres personnes ont eu ce problème mais je ne vois pas de solution facile. J'utilise Solr 3.4.0 sur Windows Server 2003 . Avez-vous des idées sur la façon de résoudre ce problème ?

À titre d'information, Drupal utilise Solr pour la recherche et cela fonctionne. Mais ce que je n'arrive pas à faire fonctionner, c'est que Solr indexe les documents PDF et Word. Je suis sûr qu'il s'agit d'un besoin commun à la plupart des sites Web, mais j'ai passé des jours sur ce sujet et je n'arrive pas à croire qu'il soit si mal documenté et si difficile à comprendre.

Demandé el 27 de Octobre, 2011 par John81

Answer 1

1 Réponses

Answer 2

4voto

Jayendra Points 27472

Si vous exécutez Solr à partir du répertoire d'exemple avec la configuration jetty, il devrait fonctionner tel quel sans aucune modification.

Cependant, pour une installation multicore, vous devez copier les jars dans le répertoire lib. .

Si vous vérifiez le solrconfig dans les dossiers d'exemple, il inclut les jars pour la cellule solr et les bibliothèques d'extraction.

solrconfig.xml -

Décommentez cette ligne pour inclure tous les bocaux de la bibliothèque.

<lib dir="./lib" />

Copiez les jars de ces dossiers dans votre dossier multicore lib. Ces jars sont utilisés pour l'extraction. (Apache pdfbox, poi, fontbox etc)

<lib dir="../../dist/" regex="apache-solr-cell-\d.*\.jar" />
<lib dir="../../contrib/extraction/lib" />

Lorsque vous démarrez Solr, vous devriez voir tous les pots chargés. Cela devrait vous permettre de travailler.

Répondu el 27 de Octobre, 2011 par Jayendra (27472 Points )

Faire fonctionner le ExtractingRequestHandler dans Solr

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

Faire fonctionner le ExtractingRequestHandler dans Solr

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: