des ensembles de données accessibles au public que vous pouvez télécharger et utiliser. Vous trouverez ci-dessous quelques exemples.
http://www.netflixprize.com/index - Dans le cadre d'un concours, elle a publié un ensemble de données d'évaluations d'utilisateurs afin de mettre les gens au défi de développer de meilleurs algorithmes de recommandation. algorithmes de recommandation. Les données non compressées s'élèvent à 2 GB+ . Il contient Plus de 100 millions d'évaluations de films par 480 000 utilisateurs sur 17 000 films.
http://aws.amazon.com/publicdatasets/ - Par exemple, l'un des données biologiques est un génome humain annoté d'environ 550 Go. Sous économie, vous pouvez trouver des ensembles de données, tels que le recensement américain de 2000 (environ 200 GO).
http://boston.lti.cs.cmu.edu/Data/clueweb09/ -Université de Carnegie Mellon Language Technologies Institute de l'université de Mellon a publié l'ensemble de données ClueWeb09 pour faciliter recherche sur le web à grande échelle. Il s'agit d'une exploration d'un milliard de pages web dans 10 langues. L'ensemble de données L'ensemble de données non compressées occupe 25 To.