60 votes

Quelles sont les valeurs possibles pour data_augmentation_options dans la configuration du pipeline de détection d'objets TensorFlow?

J'ai réussi à former un objet modèle de détection avec TensorFlow avec l'exemple de configurations donné ici: https://github.com/tensorflow/models/tree/master/object_detection/samples/configs

Maintenant, je veux affiner ma configuration pour obtenir de meilleurs résultats. L'une des options prometteuses je vois là-bas est le "data_augmentation_options" sous "train_config". Actuellement, il ressemble à ceci:

train_config: {
  batch_size: 1
  ...
  data_augmentation_options {
    random_horizontal_flip {
    }
  }
}

Il existe d'autres options pour effectuer aléatoire, le redimensionnement, le recadrage ou l'optimisation de la luminosité?

92voto

Najih Km Points 491

La liste des options est fournie dans preprocessor.proto :

 NormalizeImage normalize_image = 1;
RandomHorizontalFlip random_horizontal_flip = 2;
RandomPixelValueScale random_pixel_value_scale = 3;
RandomImageScale random_image_scale = 4;
RandomRGBtoGray random_rgb_to_gray = 5;
RandomAdjustBrightness random_adjust_brightness = 6;
RandomAdjustContrast random_adjust_contrast = 7;
RandomAdjustHue random_adjust_hue = 8;
RandomAdjustSaturation random_adjust_saturation = 9;
RandomDistortColor random_distort_color = 10;
RandomJitterBoxes random_jitter_boxes = 11;
RandomCropImage random_crop_image = 12;
RandomPadImage random_pad_image = 13;
RandomCropPadImage random_crop_pad_image = 14;
RandomCropToAspectRatio random_crop_to_aspect_ratio = 15;
RandomBlackPatches random_black_patches = 16;
RandomResizeMethod random_resize_method = 17;
ScaleBoxesToPixelCoordinates scale_boxes_to_pixel_coordinates = 18;
ResizeImage resize_image = 19;
SubtractChannelMean subtract_channel_mean = 20;
SSDRandomCrop ssd_random_crop = 21;
SSDRandomCropPad ssd_random_crop_pad = 22;
SSDRandomCropFixedAspectRatio ssd_random_crop_fixed_aspect_ratio = 23;
 

Vous pouvez voir les détails de chaque option dans preprocessor.py . Les arguments peuvent être fournis sous forme de paires clé-valeur.

   data_augmentation_options {
    ssd_random_crop {
    }
  }
  data_augmentation_options {
    random_pixel_value_scale {
      minval: 0.6
    }
  }
 

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X