101 votes

Keras: la différence entre les abandons LSTM et les abandons récurrents LSTM

À partir de la Keras de la documentation:

décrochage: Flotter entre 0 et 1. La Fraction des parts à la baisse pour le transformation linéaire des entrées.

recurrent_dropout: Flotter entre 0 et 1. La Fraction des parts de baisse pour la transformation linéaire récurrents de l'état.

Quelqu'un peut-il point à l'endroit où sur l'image ci-dessous chacun de décrochage qui se passe?

enter image description here

101voto

Michele Tonutti Points 2289

Je suggère de jeter un oeil à (la première partie du présent document. Régulière de décrochage est appliqué sur les entrées et/ou sorties, sens des flèches verticales de x_t et h_t. Dans votre cas, si vous ajouter, comme un argument de votre couche, il va masquer les entrées; vous pouvez ajouter un Décrochage de la couche après votre récurrente de la couche de masque sorties. Récurrent d'abandon des masques (ou "gouttes") les connexions entre des unités récurrentes, ce qui serait le flèches horizontales dans votre image.

Cette photo est prise de l'étude ci-dessus. Sur la gauche, régulières d'abandon sur les entrées et les sorties. Sur la droite, régulière d'abandon les PLUS récurrentes d'abandon:

This picture is taken from the paper above. On the left, regular dropout on inputs and outputs. On the right, regular dropout PLUS recurrent dropout.

(Ignorer la couleur des flèches dans ce cas; dans le papier, ils font un autre point de garder le même abandon des masques à chaque timestep)

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X