34 votes

Meilleur système de fichiers distribué pour la batterie de stockage linux de base

J'ai un lot de pièces de rechange d'intel serveurs linux autour de la pose (des centaines) et que vous souhaitez les utiliser pour un système de fichiers distribués dans un site web d'hébergement et de partage de fichiers de l'environnement. Ce n'est pas pour un CPS de l'application, de sorte que de haute performance n'est pas critique. La principale exigence est de haute disponibilité, si un serveur est hors ligne, les données stockées sur les disques durs est toujours disponible à partir d'autres nœuds. Il doit s'exécuter sur TCP/IP et de fournir la norme POSIX autorisations de fichier.

J'ai regardé le suivant:

  • Lustre (http://wiki.lustre.org/index.php?title=Main_Page): Vient vraiment proche, mais il ne fournit pas de redondance des données sur un nœud. Vous devez rendre les données d'HA à l'aide de RAID ou de DRBD. Pris en charge par le Soleil et l'Open Source, de sorte qu'il devrait être autour pendant un moment

  • gfarm (http://datafarm.apgrid.org/): il Semble qu'il fournit la redondance, mais au prix de la complexité et de la maintenabilité. Pas pris en charge que du Lustre.

Quelqu'un a une expérience avec ce produit ou de tout autre système qui pourrait fonctionner?

21voto

Javier Points 33134

vérifiez également GlusterFS

Edit (Août-2012): Ceph est enfin prêt. Récemment, les auteurs ont formé Inktank, une entreprise indépendante à vendre à des conditions commerciales favorables. Selon certains presentaions, le montage conforme à POSIX système de fichiers est la couche la plus élevée et pas vraiment encore testé, mais les couches inférieures sont utilisées dans la production pendant un certain temps maintenant.

La partie intéressante est la ORAD de la couche, qui présente un objet de stockage en fonction à la fois d'une "native" de l'accès via l' librados bibliothèque (disponible en plusieurs langues) et de Amazon S3 compatible REEE de l'API. Soit on en fait plus que suffisant pour l'ajout de stockage massive à un service web.

Cette vidéo est une bonne description de la philosophie, l'architecture, les capacités et l'état actuel.

5voto

Adrian Goldberg Points 21

À mon avis, le meilleur système de fichiers pour Linux est MooseFS, il est assez nouveau, mais j’ai eu l’occasion de le comparer à Ceph et Lustre et j’affirme avec certitude que MooseFS est le meilleur.

4voto

user566016 Points 59

Gluster fait beaucoup parler de lui en ce moment:

http://www.gluster.org/

2voto

kurtenbach Points 21

Si quelqu'un vous oblige à l'utiliser, je vous recommande vivement d'utiliser autre chose que du Lustre. De ce que j'ai entendu d'autres et ce aussi me suis donné des cauchemars depuis quelques temps, c'est le fait que le Lustre assez facilement se décompose dans toutes sortes de situations. Et si un seul client dans le système tombe en panne, elle se met dans une interminable do_nothing_loop mode typiquement tout en maintenant certaines importants à l'échelle mondiale de verrouillage de sorte que la prochaine fois qu'un client tente d'accéder à la même information, il a également accrocher. Ainsi, vous finissent souvent le redémarrage de l'ensemble du cluster, qui je pense est quelque chose que vous essayez d'éviter normalement ;)

Moderne parallèle systèmes de fichiers comme FhGFS (http://www.fhgfs.com) sont plus robustes ici et vous permettent également de faire de belles choses comme la course de composants client et serveur sur la même machine (si intégré dans les fonctionnalités HA sont encore en cours de développement, comme quelqu'un de leur équipe m'a dit, mais leur mise en œuvre va être assez impressionnant de ce que j'ai entendu).

2voto

Chris herzig Points 11

Lustre a fonctionné pour nous. Ce n’est pas parfait, mais c’est la seule chose que nous ayons essayée et qui n’ait pas perdu de sa charge. Nous obtenons toujours LBUGS de temps en temps et traiter avec des systèmes de fichiers de 100 To + n’est jamais facile, mais le système Lustre a fonctionné et a augmenté les performances et la disponibilité.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X