Stabilité du logsoftmax

Question

Stabilité du logsoftmax

Demandé el 20 de Mai, 2017: Quand la question a-t-elle été
1302 affichage: Nombre de visites la question a
4 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Je sais comment rendre le softmax stable en ajoutant à chaque élément -max _i x_i. Cela évite le débordement et le débordement inférieur. Maintenant, prendre le logarithme de cela peut provoquer un débordement. Le log softmax(x) peut évaluer à zéro, conduisant à -infini.

Je ne suis pas sûr comment le résoudre. Je sais que c'est un problème courant. J'ai lu plusieurs réponses à ce sujet, que je n'ai pas comprises. Mais je suis toujours confus sur comment résoudre ce problème.

PS : Si vous fournissez un exemple simple, ce serait génial.

Demandé el 20 de Mai, 2017 par Abhishek Bhatia

Answer 1

4 Réponses

Answer 2

13voto

e_soroush Points 1725

Pour stabiliser Logsoftmax, la plupart des implémentations telles que Tensorflow et Thenao, utilisent une astuce qui retire le composant le plus grand max(x_i). Cette astuce est souvent utilisée pour calculer de manière stable softmax. Pour logsoftmax, nous commençons par :

formule

Après avoir extrait exp(b) et utilisé le fait que log(exp(x)) = x, nous avons :

formule

Si nous définissons b = max(x_i) , cette nouvelle équation a à la fois des conditions de stabilité de dépassement et de sous-débit.

En termes de code, si x est un vecteur :

def log_softmax(x):
    x_off = x - np.max(x)
    return x_off - np.log(np.sum(np.exp(x_off)))

Voir aussi : https://timvieira.github.io/blog/post/2014/02/11/exp-normalize-trick/

Répondu el 1 de Septembre, 2018 par e_soroush (1725 Points )

Answer 3

1voto

user3113854 Points 26

logsoftmax = logits - log(reduce_sum(exp(logits), dim))

référence : https://www.tensorflow.org/api_docs/python/tf/nn/log_softmax

Répondu el 12 de Décembre, 2017 par user3113854 (26 Points )

Answer 4

0voto

Keshav Kumar Points 1

Utilisez simplement ceci car il prend en charge Nan

tf.nn.softmax_cross_entropy_with_logits(
    labels, logits, axis=-1, name=None
)

logits = tf.constant([[4, 5, 1000]], dtype = tf.float32)
labels = tf.constant([[1,0,1]], dtype = tf.float32)

# Cas-1
output = tf.nn.softmax_cross_entropy_with_logits(labels=labels, logits=logits)
print(output) 
>>> tf.Tensor([996.], shape=(1,), dtype=float32)

#Cas-2
a = tf.nn.softmax(logits)
output = tf.reduce_sum(-(labels * tf.math.log(a)))
print(output) 
>>> tf.Tensor(nan, shape=(), dtype=float32)

# cela se produit car la valeur du softmax est tronquée à zéro

print(a) 
>>>

Répondu el 22 de Mai, 2021 par Keshav Kumar (1 Points )

Answer 5

-1voto

prosti Points 4630

Les astuces mathématiques ne peuvent pas vous aider à faire en sorte que log 0 soit autre chose que -∞. Si vous y réfléchissez bien, la seule solution est de normaliser les données pour éviter d'en arriver là.

Répondu el 9 de Juillet, 2019 par prosti (4630 Points )

Stabilité du logsoftmax

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Stabilité du logsoftmax

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: