2 votes

outils d'exploration de données et d'analyse de texte open source en python

J'ai une base de données remplie d'avis sur divers produits. Ma tâche consiste à effectuer divers calculs et à "créer" une autre "base de données/xml-export" avec les données agrégées. Je pense écrire des programmes en ligne de commande en python pour faire cela. Mais je sais que quelqu'un l'a déjà fait et qu'il existe une solution open source en python ou similaire qui donne probablement des "données agrégées" beaucoup plus intéressantes que ce que je peux imaginer.

Le problème est que je ne connais pas grand chose à ce domaine, si ce n'est la manipulation de données de base en ligne de commande, et que je ne sais pas non plus quels sont les termes que je devrais utiliser pour rechercher cette chose. Je ne cherche vraiment pas des trucs scientifiques/de visualisation (mais ça ne me dérange pas si l'outil en fournit), quelque chose de simple pour commencer et progressivement voir/développer ce dont j'ai besoin.

Ma seule exigence est que les "données agrégées finales" soient dans une base de données ou exportées sous forme de fichier XML, pas d'éléments propriétaires. C'est un peu plus robuste que mes scripts car je dois traiter des "lots" de données sur 4 machines.

Des indications sur la manière de commencer mes recherches ?

Gracias.

1voto

lost-theory Points 4356

Quel type d'analyse essayez-vous de faire ?

Si vous analysez du texte, jetez un coup d'œil à la rubrique Boîte à outils pour le langage naturel (NLTK).

Si vous souhaitez indexer et rechercher les données, jetez un coup d'œil à la rubrique souffle moteur de recherche.

Veuillez fournir plus de détails sur le type d'analyse que vous souhaitez effectuer.

1voto

Amro Points 72743

Il semble que vous recherchiez un Intégration des données solution.
L'une des suggestions est le logiciel libre Projet de bouilloire partie de la Pentaho suite.
Pour python, une recherche rapide a donné PyDI y SnapLogic

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X