2 votes

Taille de données inégale sur les nœuds de Cassandra

Je lutte pour comprendre pourquoi mes nœuds Cassandra ont une taille de données inégale.

J'ai un cluster de trois nœuds. Selon nodetool ring, chaque nœud possède 33,33%. Pourtant, les utilisations de l'espace disque sont inégales.

Nœud1: 4,7 Go (DC: logg_2, RAC: RAC1)
Nœud2: 13,9 Go (DC: logg_2, RAC:RAC2)
Nœud3: 9,3 Go (DC: logg_2, RAC:RAC1)

Il n'y a qu'un seul keyspace.

définition_keyspace: |
 CREER KEYSPACE stresscql_cass_logg AVEC replication = { 'class': 'NetworkTopologyStrategy', 'logg_2' : 2, 'logg_1' : 1};

Et il n'y a qu'une seule table nommée blogposts.

définition_table: |
  CREER TABLE blogposts (
        domaine texte,
        date_publication timeuuid,
        url texte,
        auteur texte,
        titre texte,
        corps texte,
        PRIMARY KEY(domaine, date_publication)
  ) AVEC CLUSTERING ORDER BY (date_publication DESC)
    AND compaction = { 'class':'LeveledCompactionStrategy' }
    AND comment='Une table pour contenir des articles de blog'

S'il vous plaît aidez-moi à comprendre pourquoi chaque nœud a une taille de données inégale.

2voto

sandra08 Points 46

La propriété est la quantité de données possédée par le nœud.

Le pourcentage des données possédées par le nœud par centre de données multiplié par le facteur de réplication. Par exemple, un nœud peut posséder 33 % de l'anneau, mais afficher 100 % si le facteur de réplication est de 3.

Attention : Si votre cluster utilise des keyspaces ayant différentes stratégies de réplication ou des facteurs de réplication différents, spécifiez un keyspace lorsque vous exécutez nodetool status pour obtenir des informations de propriété significatives.

Vous trouverez plus d'informations ici : https://docs.datastax.com/en/cassandra/2.1/cassandra/tools/toolsStatus.html#toolsStatus__description

NetworkTopologyStrategy place les répliques dans le même centre de données en parcourant l'anneau dans le sens horaire jusqu'à atteindre le premier nœud dans un autre rack.

NetworkTopologyStrategy tente de placer les répliques sur des racks distincts car les nœuds dans le même rack (ou groupement physique similaire) échouent souvent en même temps en raison de problèmes d'alimentation, de refroidissement ou de réseau.

Comme vous n'avez que deux racks (RAC1 et RAC2), vous placez les répliques du nœud 1 et du nœud 3 dans le nœud 2, c'est pourquoi il est plus grand.

https://docs.datastax.com/en/cassandra/3.0/cassandra/architecture/archDataDistributeReplication.html

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X