Entraînement de mon propre modèle SyntaxNet pour le corpus Spanish-Ancora UD en suivant les instructions de ici ne m'a pas donné d'erreurs.
Après toutes les étapes, les fichiers finaux créés sont les suivants :
-category-map
-char-map
-checkpoint
-context
-graph
-label-map
-latest-model
-latest-model.meta
-lcword-map
-model
-model.meta
-prefix-table
-status
-suffix-table
-tag-map
-tag-to-category
-tagged-dev-corpus
-tagged-training-corpus
-tagged-tunning-corpus
-word-map
Le fichier context.pbtxt utilisé pour la formation est celui de syntaxnet/modèles/parsey_universal.
Ensuite, lorsque j'essaie de le tester en appelant parser.sh
de syntaxnet/modèles/parsey_universal renvoie quelques erreurs :
F syntaxnet/term_frequency_map.cc:63] Check failed: ::tensorflow::Status::OK() == (tensorflow::Env::Default()->NewRandomAccessFile(filename, &file)) (OK vs. Not found: syntaxnet/models/parsey_universal/modeltest/char-ngram-map)
F syntaxnet/term_frequency_map.cc:63] Check failed: ::tensorflow::Status::OK() == (tensorflow::Env::Default()->NewRandomAccessFile(filename, &file)) (OK vs. Not found: syntaxnet/models/parsey_universal/modeltest/morphology-map)
J'ai ensuite téléchargé le modèle pré-entraîné espagnol à partir de ici . J'ai vérifié les fichiers. Il semble qu'il y ait deux fichiers manquants, le modèle pré-entraîné les a par défaut mais dans celui que j'ai entraîné, ces fichiers manquaient.
Ma question est donc de savoir comment obtenir ces fichiers dans la phase de formation de SyntaxNet.
il existe d'autres moyens de les produire ?
Dois-je le tester d'une autre manière ?