Je suggère de jeter un oeil à (la première partie du présent document. Régulière de décrochage est appliqué sur les entrées et/ou sorties, sens des flèches verticales de x_t
et h_t
. Dans votre cas, si vous ajouter, comme un argument de votre couche, il va masquer les entrées; vous pouvez ajouter un Décrochage de la couche après votre récurrente de la couche de masque sorties. Récurrent d'abandon des masques (ou "gouttes") les connexions entre des unités récurrentes, ce qui serait le flèches horizontales dans votre image.
Cette photo est prise de l'étude ci-dessus. Sur la gauche, régulières d'abandon sur les entrées et les sorties. Sur la droite, régulière d'abandon les PLUS récurrentes d'abandon:
(Ignorer la couleur des flèches dans ce cas; dans le papier, ils font un autre point de garder le même abandon des masques à chaque timestep)