Dans le tutoriel pour MNIST Il apparaît que l'ensemble de données est divisé en trois ensembles différents : (1) ensembles_de_donnees.train , (2) data_sets.validation et (3) data_sets.test . Cependant, dans la boucle d'apprentissage, seule la ensembles_de_donnees.train est utilisé pour la formation.
# Start the training loop.
for step in xrange(FLAGS.max_steps):
start_time = time.time()
# Fill a feed dictionary with the actual set of images and labels
# for this particular training step.
feed_dict = fill_feed_dict(data_sets.train,
images_placeholder,
labels_placeholder)
Et chaque (step + 1) % 1000 == 0 or (step + 1) == FLAGS.max_steps
le modèle est évalué de manière à obtenir trois évaluations différentes : (1) évaluation des données d'apprentissage, (2) évaluation des données de validation et (3) évaluation des données de test.
En général, dans l'apprentissage automatique, l'ensemble de validation est utilisé pour affiner les paramètres du modèle et améliorer la courbe d'apprentissage.
Comment l'ensemble de validation est-il utilisé dans Tensorflow afin d'améliorer la courbe d'apprentissage ?