Quand NE PAS utiliser Cassandra ?

Question

Quand NE PAS utiliser Cassandra ?

Demandé el 14 de Avril, 2010: Quand la question a-t-elle été
17647 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

Il y a eu beaucoup de discussions concernant Cassandra dernièrement.

Twitter, Digg, Facebook, etc. l'utilisent tous.

Quand cela a-t-il un sens de :

utiliser Cassandra,
ne pas utiliser Cassandra, et
utiliser un RDMS au lieu de Cassandra.

Demandé el 14 de Avril, 2010 par JimJim

7 votes

Il devrait probablement être CW ? Il s'agit essentiellement de bases de données NoSQL contre bases de données relationnelles, ce qui est assez subjectif.

Commenté el 14 de Avril, 2010 par Ed Woodcock

3 votes

J'aimerais savoir s'il convient au système de messagerie. Je suppose que si Twitter l'utilise, il n'y a pas de problème, mais il se peut qu'ils ne l'utilisent pas pour l'ensemble de Twitter ?

Commenté el 14 de Avril, 2010 par Luke

0 votes

techblog.bozho.net/?p=232

Commenté el 14 de Septembre, 2010 par Bozho

Answer 1

5 Réponses

Answer 2

57voto

Nathan Hurst Points 938

Lorsque vous évaluez des systèmes de données distribués, vous devez tenir compte du théorème CAP - vous pouvez choisir deux des éléments suivants : cohérence, disponibilité et tolérance de partition.

Cassandra est un système disponible, tolérant aux partitions et prenant en charge la cohérence éventuelle. Pour plus d'informations, voir ce billet de blog que j'ai écrit : Guide visuel des systèmes NoSQL .

Répondu el 20 de Avril, 2010 par Nathan Hurst (938 Points )

0 votes

A quand remonte la dernière fois que vous avez vu une partition où les deux partitions étaient grandes ? Voir ma question stackoverflow.com/questions/7969874/

Commenté el 3 de Novembre, 2011 par Aaron Watters

5 votes

Apparemment, Cassandra vous permet également de spécifier vos exigences en matière de cohérence au moment de la requête, ce qui peut constituer un compromis utile pour certains cas d'utilisation.

Commenté el 11 de Février, 2015 par Richard Marr

Answer 3

34voto

Vagif Verdi Points 2380

Cassandra est la réponse à un problème particulier : que faites-vous lorsque vous avez tellement de données qu'elles ne tiennent pas sur un seul serveur ? Comment stocker toutes vos données sur plusieurs serveurs sans crever votre compte en banque et sans rendre vos développeurs fous ? Facebook reçoit 4 téraoctets de nouvelles données compressées CHAQUE JOUR. Et ce chiffre va très probablement doubler en l'espace d'un an.

Si vous ne disposez pas d'autant de données ou si vous avez des millions à payer pour l'installation d'un cluster Oracle/DB2 d'entreprise et les spécialistes nécessaires à sa mise en place et à sa maintenance, alors vous pouvez vous contenter d'une base de données SQL.

Cependant, Facebook n'utilise plus Cassandra et utilise désormais presque exclusivement MySQL, déplaçant le partitionnement vers le haut de la pile d'applications pour des performances plus rapides et un meilleur contrôle.

Répondu el 24 de Avril, 2010 par Vagif Verdi (2380 Points )

2 votes

Savez-vous pourquoi FB a cessé d'utiliser Cassandra ? Que voulez-vous dire par "déplacer le partitionnement vers le haut de la pile d'applications" ? Est-ce que FB utilise plusieurs tables MySQL et décide laquelle utiliser pour un ensemble de données en utilisant une logique d'application ?

Commenté el 15 de Juillet, 2020 par Manu Chadha

0 votes

@Vargif Verdi MongoDB peut également répondre à votre problème particulier, n'est-ce pas ?... donc dans ce cas, devrions-nous utiliser mongodb ou casandra ?

Commenté el 27 de Juillet, 2020 par MrA

Answer 4

29voto

Tom Clarkson Points 12369

L'idée générale de NoSQL est que vous devriez utiliser le magasin de données le mieux adapté à votre application. Si vous avez un tableau de données financières, utilisez SQL. Si vous avez des objets dont la mise en correspondance avec un schéma relationnel nécessiterait des requêtes complexes et lentes, utilisez un magasin d'objets ou de clés/valeurs.

Bien entendu, la plupart des problèmes que vous rencontrez dans le monde réel se situent entre ces deux extrêmes et aucune solution ne sera parfaite. Vous devez prendre en compte les capacités de chaque magasin et les conséquences de l'utilisation de l'un plutôt que de l'autre, qui seront très spécifiques au problème que vous essayez de résoudre.

Répondu el 14 de Avril, 2010 par Tom Clarkson (12369 Points )

0 votes

Quel est l'avantage de sql lorsqu'on utilise des données financières ?

Commenté el 26 de Avril, 2010 par Paco

3 votes

Il est peu probable que le schéma change, il s'intègre bien dans une structure de table, et des données perdues/inconsistantes pourraient causer de réels problèmes.

Commenté el 27 de Avril, 2010 par Tom Clarkson

4 votes

Je ne comprends pas pourquoi des données incohérentes peuvent causer de réels problèmes aux banques. Scénario : vous avez un compte bancaire, sur lequel vous avez versé 100 $ au-dessus de la limite fixée, et deux cartes bancaires. Lorsque vous essayez de retirer de l'argent avec les deux cartes en même temps à deux distributeurs automatiques différents, vous recevez deux fois 100 $ et une lettre avec des frais supplémentaires dans votre boîte aux lettres. La banque gagne de l'argent (les frais supplémentaires pour être en dessous de la limite) en utilisant des données incohérentes. Il est trop difficile de connecter tous les distributeurs automatiques de billets du monde les uns aux autres par le biais d'une grande base de données relationnelle. Pouvez-vous donner un exemple où des données financières incohérentes peuvent être un problème ?

Commenté el 27 de Avril, 2010 par Paco

Afficher 8 autres commentaires

Answer 5

10voto

Warren Points 21

En parlant avec quelqu'un qui est en train de déployer Cassandra, il ne gère pas bien le many-to-many. Ils font un travail de pirate pour faire leurs tests initiaux. J'ai parlé avec un consultant Cassandra à ce sujet et il a dit qu'il ne le recommanderait pas si vous aviez ce problème.

Répondu el 6 de Juin, 2010 par Warren (21 Points )

Answer 6

4voto

sinelaw Points 6641

Une seule requête lourde contre des milliards de requêtes légères La charge est un autre point à considérer, en plus des autres réponses ici. Il est intrinsèquement plus difficile d'optimiser automatiquement une requête unique dans une base de données de type NoSql. J'ai utilisé MongoDB et j'ai rencontré des problèmes de performance en essayant de calculer une requête complexe. Je n'ai pas utilisé Cassandra mais je m'attends à ce qu'il ait le même problème.

D'un autre côté, si vous prévoyez que votre charge sera constituée d'un grand nombre de petites requêtes, et que vous voulez être en mesure d'évoluer facilement, vous pouvez tirer parti de la cohérence éventuelle offerte par la plupart des bases de données NoSql. Notez que la cohérence éventuelle n'est pas vraiment une caractéristique d'un modèle de données non relationnel, mais elle est beaucoup plus facile à mettre en œuvre et à configurer dans un système basé sur NoSql.

Pour une seule requête très lourde, n'importe quel moteur de SGBDR moderne peut faire un travail décent de parallélisation de certaines parties de la requête et tirer parti d'autant de CPU et de mémoire que vous lui donnez (sur une seule machine). Les bases de données NoSql ne disposent pas de suffisamment d'informations sur la structure des données pour être en mesure de faire des hypothèses qui permettront une parallélisation vraiment intelligente d'une grande requête. Elles vous permettent d'augmenter facilement le nombre de serveurs (ou de cœurs), mais dès que la requête atteint un certain niveau de complexité, vous êtes obligé de la diviser manuellement en parties que le moteur NoSql sait traiter intelligemment.

D'après mon expérience avec MongoDB, en raison de la complexité de la requête, Mongo ne pouvait pas faire grand-chose pour l'optimiser et en exécuter certaines parties sur plusieurs données. Mongo parallélise les requêtes multiples mais n'est pas très doué pour en optimiser un seul.

Répondu el 9 de Avril, 2013 par sinelaw (6641 Points )

Quand NE PAS utiliser Cassandra ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Quand NE PAS utiliser Cassandra ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: