J'essaie de faire fonctionner Solr avec Tika afin de pouvoir indexer des documents Word et PDF dans mon site Web Drupal.
J'ai regardé les Page du wiki y esto page et ils indiquent d'ajouter un requestHandler dans solrconfig.xml.
J'ai fait cela et maintenant Solr jette une exception :
org.apache.solr.common.SolrException : Erreur de chargement de la classe 'org.apache.solr.handler.extraction.ExtractingRequestHandler'.
J'ai fait quelques recherches et je vois que d'autres personnes ont eu ce problème mais je ne vois pas de solution facile. J'utilise Solr 3.4.0 sur Windows Server 2003 . Avez-vous des idées sur la façon de résoudre ce problème ?
À titre d'information, Drupal utilise Solr pour la recherche et cela fonctionne. Mais ce que je n'arrive pas à faire fonctionner, c'est que Solr indexe les documents PDF et Word. Je suis sûr qu'il s'agit d'un besoin commun à la plupart des sites Web, mais j'ai passé des jours sur ce sujet et je n'arrive pas à croire qu'il soit si mal documenté et si difficile à comprendre.