Comment empiler plusieurs lstm dans keras?

Question

Comment empiler plusieurs lstm dans keras?

Demandé el 30 de Octobre, 2016: Quand la question a-t-elle été
14908 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Je suis à l'aide de l'apprentissage en profondeur de la bibliothèque de keras et d'essayer de les empiler plusieurs LSTM avec pas de chance. Ci-dessous mon code

model = Sequential()
model.add(LSTM(100,input_shape =(time_steps,vector_size)))
model.add(LSTM(100))

Le code ci-dessus renvoie l'erreur dans la troisième ligne, Exception: Input 0 is incompatible with layer lstm_28: expected ndim=3, found ndim=2

L'entrée X est un tenseur de forme (100,250,50). Je suis en cours d'exécution keras sur tensorflow backend

Demandé el 30 de Octobre, 2016 par Tamim Addari

Answer 1

2 Réponses

Answer 2

156voto

Daniel Adiwardana Points 1384

Vous avez besoin d'ajouter return_sequences=True pour la première couche, de sorte que sa sortie tenseur a ndim=3 (c'est à dire la taille du lot, échéances, état caché).

Veuillez voir l'exemple suivant:

# expected input data shape: (batch_size, timesteps, data_dim)
model = Sequential()
model.add(LSTM(32, return_sequences=True,
               input_shape=(timesteps, data_dim)))  # returns a sequence of vectors of dimension 32
model.add(LSTM(32, return_sequences=True))  # returns a sequence of vectors of dimension 32
model.add(LSTM(32))  # return a single vector of dimension 32
model.add(Dense(10, activation='softmax'))

De: https://keras.io/getting-started/sequential-model-guide/ (de la recherche pour "empilés lstm")

Répondu el 31 de Octobre, 2016 par Daniel Adiwardana (1384 Points )

Answer 3

24voto

shantanu pathak Points 111

Une explication détaillée de @DanielAdiwardana 's réponse. Nous avons besoin d'ajouter return_sequences=True pour tous les LSTM les calques sauf le dernier.

Cette option à True permet de Keras sais que LSTM sortie doit contenir tous les produits générés, ainsi que le temps de timbres (3D). Donc, la prochaine LSTM couche peut travailler sur les données.

Si ce drapeau est faux, alors LSTM retourne uniquement la dernière sortie (2D). Cette sortie n'est pas assez bon pour un autre LSTM couche.

# expected input data shape: (batch_size, timesteps, data_dim)
model = Sequential()
model.add(LSTM(32, return_sequences=True,
               input_shape=(timesteps, data_dim)))  # returns a sequence of vectors of dimension 32
model.add(LSTM(32, return_sequences=True))  # returns a sequence of vectors of dimension 32
model.add(LSTM(32))  # return a single vector of dimension 32
model.add(Dense(10, activation='softmax'))

Sur une NOTE de côté :: dernière couche Dense est ajouté pour obtenir une sortie dans le format requis par l'utilisateur. Ici Dense(10) signifie que 10 classes différentes de sortie sera généré à l'aide de softmax d'activation.

Dans le cas où vous utilisez LSTM pour le temps de la série , alors vous devriez avoir Dense(1). De sorte qu'une seule sortie numérique est donné.

Répondu el 16 de Janvier, 2019 par shantanu pathak (111 Points )

Comment empiler plusieurs lstm dans keras?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment empiler plusieurs lstm dans keras?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: