Connaissez-vous un grand ensemble de données gratuit ou peu coûteux pour expérimenter avec Hadoop ? Nous vous remercions pour toute indication ou tout lien.
Préférence :
-
Au moins un Go de données.
-
Données du journal de production du serveur web.
J'en ai trouvé quelques-uns jusqu'à présent :
Pouvons-nous également utiliser notre propre robot d'exploration pour recueillir des données sur des sites tels que Wikipédia ? Toute indication sur la façon de procéder est également appréciée.
0 votes
Datanami a récemment publié cette liste de liens : datanami.com/2015/01/29/9-places-get-big-data-now - peut-être que quelqu'un a le temps de convertir ceci en une réponse appropriée.