Je dirais que DryadLinq est ce qui se rapproche le plus d'Hadoop pour les utilisateurs de .NET. Mais cela dépend de ce que vous voulez faire avec Hadoop. Si vous recherchez un système de fichiers distribués (DFS) auto-entretenu et optimisé, alors DryadLINQ n'est pas ce que vous recherchez. Il a une analogie avec le DFS mais vous devez construire manuellement les partitions et distribuer chaque partition.
Ceci étant dit, si c'est l'aspect exécution distribuée de Hadoop que vous recherchez, DryadLINQ est vraiment merveilleux (et non, je ne suis pas affilié à MS). Tant que vous avez un Microsoft HPC L'installation du cluster que le démarrage avec DryadLINQ est vraiment facile.
Le code que vous écrivez est en fait du code LINQ pur, sauf qu'au lieu d'exécuter le LINQ sur IEnumerable<T>
vous devez l'exécuter sur PartitionedTable<T>
(la structure de données distribuée auto-construite).
Ce qui est vraiment bien avec DryadLINQ, c'est la rapidité avec laquelle les algorithmes sont développés (essayer, tester, ajuster, répéter). Il vous suffit d'écrire du code LINQ pour effectuer vos calculs et DryadLINQ s'occupe de toute la partie exécution distribuée. C'est l'analogie la plus naturelle que j'ai rencontrée qui rend l'écriture de code pour le traitement distribué tout comme l'écriture de code pour le traitement à processus unique.