4 votes

Pourquoi n'y a-t-il pas assez d'accélérateurs lorsque j'exécute des travaux gcloud ml-engine ?

J'essaie d'exécuter un Machine Learning Jon dans Google Cloud, mais il me dit toujours qu'il n'y a pas assez d'accélérateurs disponibles, j'ai essayé avec le paramètre ----scale-tier=BASIC | BASIC_GPU | STANDARD_1 | PREMIUM_1 . et aboutit au même résultat.

Voici la commande et le résultat :

gcloud ml-engine jobs submit training object_detection_`date +%s`     --job-dir=gs://${TRAIN_DIR}     --packages dist/object_detection-0.1.tar.gz,slim/dist/slim-0.1.tar.gz     --module-name object_detection.train     --region us-central1     --config ${PATH_TO_LOCAL_YAML_FILE}     --     --train_dir=gs://${TRAIN_DIR}     --pipeline_config_path=gs://${PIPELINE_CONFIG_PATH}
ERROR: (gcloud.ml-engine.jobs.submit.training) RESOURCE_EXHAUSTED: Field: scale_tier Error: Insufficient accelerators are available in region us-central1 to schedule the job which requests 6 K80 accelerators. Please wait and try again or else try submitting your job to a different region.
- '@type': type.googleapis.com/google.rpc.BadRequest
  fieldViolations:
  - description: Insufficient accelerators are available in region us-central1 to
      schedule the job which requests 6 K80 accelerators. Please wait and try again
      or else try submitting your job to a different region.
    field: scale_tier

8voto

rhaertel80 Points 6091

Les GPU sont très demandés dans les us-central1 . Je suggère d'exécuter votre travail dans us-east1 si possible, à court terme, jusqu'à ce que d'autres GPU soient disponibles.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X