Je suis nouveau dans le domaine du cntk et du python. J'ai créé un programme python basé sur TrainResNet_CIFAR10.py pour entraîner 4736 images (64x64x3) et tester 2180 images avec 4 classes. Après 160 époques d'entraînement, j'ai obtenu une perte = 0,663 et une métrique = 29,37%. La métrique de l'évaluation finale est de 18,94 %. Lorsque j'évalue le modèle d'entraînement basé sur CNTKLibraryCSEvalExamples.cs pour tester 2180 images, presque toutes les 2180 sont classées dans une seule classe (deuxième classe). Mes questions sont les suivantes :
- Je suppose que la perte est calculée à partir de cross_entropy_with_softmax(z, label_var) et que la métrique utilise classification_error(z, label_var). Ai-je raison et comment sont-elles déterminées ?
- Que signifient la métrique = 29,37 % et la métrique d'évaluation = 18,94 % ? S'agit-il d'images d'entraînement et d'images de test, respectivement ?
- Qu'est-ce qui pourrait entraîner des résultats d'évaluation totalement erronés ?
Toute aide sera grandement appréciée.