Avec stackoveflow.com en perspective (une équipe de 2 ou 3 ingénieurs construisant un projet de site web destiné à évoluer), est-il judicieux de consacrer des efforts au début du processus de développement pour construire une recherche basée sur Lucene/Autonomy par opposition à une recherche plein texte basée sur une base de données.
Pour/Contre :
Avec une implémentation mature de Lucene comme nutch ou autonomy, le coût du passage à Lucene (qui est inévitable) à un stade ultérieur est négligeable.
Pour les gros volumes, il est relativement facile d'ajouter des serveurs d'index supplémentaires (par exemple avec nutch) pour maintenir l'index de recherche croissant.
Avec une implémentation de Lucene, j'aurai probablement besoin d'un serveur supplémentaire pour gérer l'index en mémoire (bien tôt dans le processus de mise à l'échelle).