Quelles sont les compétences pertinentes dans l'arsenal d'un Data Scientist? Avec les nouvelles technologies qui arrivent tous les jours, comment peut-on choisir l'essentiel?
Quelques idées liées à cette discussion:
- Sachant SQL et l'utilisation d'une base de données comme MySQL, PostgreSQL était génial jusqu'à l'avènement de NoSql et les bases de données non relationnelles. MongoDB, CouchDB, etc. sont en train de devenir populaire à travailler avec le web de données à grande échelle.
- Sachant qu'un outil de statistiques comme R est suffisant pour l'analyse, mais pour créer des applications, on peut avoir besoin d'ajouter de Java, Python, et d'autres à la liste.
- Les données se présente sous la forme de texte, des url, des multi-médias pour n'en nommer que quelques-uns, et il y a différents paradigmes liés à leur manipulation.
- Ce sujet de clusters de calcul, calcul parallèle, le cloud, Amazon EC2, Hadoop ?
- Régression des moindres carrés ordinaires a maintenant des Réseaux de Neurones Artificiels, Forêts Aléatoires et d'autres relativement exotique d'apprentissage de la machine/de l'exploration de données algos. pour la société
Pensées?