Comprendre le ruban de gradient avec des mini-lots

Question

Comprendre le ruban de gradient avec des mini-lots

Demandé el 7 de Octobre, 2020: Quand la question a-t-elle été
255 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

Dans l'exemple ci-dessous, tiré de Documentation sur Keras Je veux comprendre comment grads est calculée. Est-ce que le gradient grads correspond au gradient moyen calculé en utilisant le lot (x_batch_train, y_batch_train) ? En d'autres termes, l'algorithme calcule-t-il le gradient, par rapport à chaque variable, en utilisant chaque échantillon du mini lot, puis en faisant la moyenne de ces échantillons pour obtenir grads ?

for epoch in range(epochs):
    print("\nStart of epoch %d" % (epoch,))

    # Iterate over the batches of the dataset.
    for step, (x_batch_train, y_batch_train) in enumerate(train_dataset):

        # Open a GradientTape to record the operations run
        # during the forward pass, which enables auto-differentiation.
        with tf.GradientTape() as tape:

            # Run the forward pass of the layer.
            # The operations that the layer applies
            # to its inputs are going to be recorded
            # on the GradientTape.
            logits = model(x_batch_train, training=True)  # Logits for this minibatch

            # Compute the loss value for this minibatch.
            loss_value = loss_fn(y_batch_train, logits)

        # Use the gradient tape to automatically retrieve
        # the gradients of the trainable variables with respect to the loss.
        grads = tape.gradient(loss_value, model.trainable_weights)

        # Run one step of gradient descent by updating
        # the value of the variables to minimize the loss.
        optimizer.apply_gradients(zip(grads, model.trainable_weights))

Demandé el 7 de Octobre, 2020 par Chao

Answer 1

2 Réponses

Answer 2

0voto

DachuanZhao Points 638

La valeur par défaut est SUM_OVER_BATCH_SIZE .

Lire este .

Répondu el 2 de Décembre, 2020 par DachuanZhao (638 Points )

Answer 3

0voto

Desperate Morty Points 36

Vos suppositions sont correctes.

La documentation fournie par DachuanZhao montre également que la somme des éléments du lot est moyennée.

Répondu el 2 de Décembre, 2020 par Desperate Morty (36 Points )

Comprendre le ruban de gradient avec des mini-lots

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comprendre le ruban de gradient avec des mini-lots

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: