J'ai déployé une application en utilisant Kubernetes sur un Cluster Google Cloud Container Engine.
Je me suis intéressé à l'auto-scaling, et j'ai trouvé les options suivantes :
Auto-scaling horizontal de pod Kubernetes (HPA)
Comme expliqué ici, Kubernetes propose l'HPA sur les déploiements. Selon la documentation ici :
L'Auto-scaling horizontal de pod ajuste automatiquement le nombre de pods dans un contrôleur de réplication, un déploiement ou un ensemble de réplicas en fonction de l'utilisation observée du CPU.
Cluster de conteneurs Google Cloud
Maintenant j'ai un Cluster de Conteneurs Google Cloud avec 3 instances, avec l'auto-scaling activé. Selon la documentation :
Le Cluster Autoscaler permet aux utilisateurs de redimensionner automatiquement les clusters pour que tous les pods programmés aient un endroit où s'exécuter.
Cela signifie que j'ai deux endroits pour définir mon auto-scaling. D'où mes questions :
- Est-ce qu'un Pod est la même chose qu'une instance VM à l'intérieur de mon cluster, ou est-ce que plusieurs Pods peuvent s'exécuter à l'intérieur d'une seule instance VM?
- Ces deux paramètres font-ils la même chose (c'est-à-dire créer/supprimer des instances VM à l'intérieur de mon cluster). Sinon, quel est leur comportement l'un par rapport à l'autre?
- Que se passe-t-il si par exemple j'ai un nombre de pods entre
3
et10
et un cluster avec un nombre d'instances entre1
et3
et que l'auto-scaling se déclenche. Quand et comment les deux vont-ils s'adapter?
Merci beaucoup!