Je voudrais découvrir un cadre MapReduce bon et robuste, à utiliser depuis Scala.
Réponses
Trop de publicités?Pour ajouter à la réponse sur Hadoop: il y a au moins deux Scala wrappers qui rendent le travail avec Hadoop plus agréable au goût.
Scala Carte de Réduire (SMR): http://scala-blogs.org/2008/09/scalable-language-and-scalable.html
SHadoop: http://jonhnny-weslley.blogspot.com/2008/05/shadoop.html
UPD 5 oct. 11
Il est également Scoobi cadre, c'est génial d'expressivité.
http://hadoop.apache.org/ est indépendant de la langue.
Il y a quelque temps, j'ai rencontré exactement ce problème et j'ai fini par écrire une petite infrastructure pour faciliter l'utilisation de Hadoop de Scala. Je l'ai utilisé seul pendant un certain temps, mais j'ai finalement réussi à le mettre sur le Web. Il s'appelle (très à l'origine) ScalaHadoop .
Pour un scala API au-dessus d'hadoop découvrez Scoobi, il est encore en développement mais montre beaucoup de promesse. Il y a aussi quelques efforts pour mettre en œuvre des distribué des collections sur le dessus d'hadoop dans le Scala incubateur, mais cet effort n'est pas utilisable encore.
Il y a aussi une nouvelle scala wrapper pour en cascade à partir de Twitter, appelé Brûlures. Après la recherche très brièvement sur la documentation de Brûlures il me semble que pendant qu'il fait de l'intégration avec en cascade lisse, il ne fonctionne toujours pas de résoudre ce que je vois comme le principal problème avec cascade: type de sécurité. Chaque opération en cascade fonctionne en cascade de n-uplets (en gros une liste des valeurs de champ avec ou sans schéma), ce qui signifie que les erreurs de type, I. e. Joindre une clé comme une Chaîne et clé en tant que de Longs fils au moment de l'exécution des échecs.