J'ai été longtemps utilisateur de R et ont récemment commencé à travailler avec Python. L'utilisation conventionnelle des systèmes SGBDR pour l'entreposage de données, et R/Python pour intensives, je ressens le besoin maintenant de me salir les mains avec de Gros d'Analyse de Données.
Je voudrais savoir comment obtenir commencé avec le Big Data crunching. - Comment commencer simplement avec Map/reduce et l'utilisation de Hadoop
- Comment puis-je tirer parti de mes compétences en R et Python pour commencer avec l'analyse des Données Big data. À l'aide de l'Python Disco projet par exemple.
- À l'aide de la RHIPE paquet et de trouver des jouet jeux de données et les zones à problème.
- Trouver la bonne information pour me permettre de me décider si j'ai besoin de déplacer vers le NoSQL de SGBDR de type bases de données
Dans l'ensemble, je voudrais savoir comment commencer petit et de construire progressivement mes compétences et mon savoir-faire dans l'Analyse des Données Big data.
Merci pour vos suggestions et recommandations. Je m'excuse pour le générique de la nature de cette requête, mais je suis à la recherche pour gagner plus de point de vue à ce sujet.
- Dure