Je cherche la méthode la plus rapide et la plus efficace pour détecter un objet dans une vidéo en mouvement. Ce qu'il faut savoir sur cette vidéo : Elle est très granuleuse et de faible résolution, et l'arrière-plan et le premier plan se déplacent simultanément.
Remarque : j'essaie de détecter un camion en mouvement sur une route dans une vidéo en mouvement.
Méthodes que j'ai essayées :
Formation d'une cascade de Haar - J'ai essayé de former les classificateurs à l'identification de l'objet en copiant plusieurs images de l'objet souhaité. Il s'est avéré que cette méthode produisait de nombreuses fausses détections ou aucune détection (l'objet recherché n'a jamais été détecté). J'ai utilisé environ 100 images positives et 4000 négatives.
Points clés SIFT et SURF - Lorsque j'ai essayé d'utiliser l'une ou l'autre de ces méthodes basées sur les caractéristiques, j'ai découvert que l'objet que je voulais détecter avait une résolution trop faible et qu'il n'y avait donc pas assez de caractéristiques à faire correspondre pour obtenir une détection précise. (L'objet souhaité n'a jamais été détecté)
Correspondance des modèles - C'est probablement la meilleure méthode que j'ai essayée. C'est la plus précise, mais aussi la plus difficile à mettre en œuvre. Je peux détecter l'objet pour une vidéo spécifique à l'aide d'un modèle découpé dans la vidéo. Cependant, la précision n'est pas garantie car tout ce qui est connu est la meilleure correspondance pour chaque image, aucune analyse n'est faite sur le pourcentage de correspondance entre le modèle et l'image. En fait, cette méthode ne fonctionne que si l'objet est toujours présent dans la vidéo, sinon la détection sera erronée.
Voilà donc les trois grandes méthodes que j'ai essayées et qui ont toutes échoué. Ce qui fonctionnerait le mieux, c'est quelque chose comme la correspondance des modèles, mais avec une invariance d'échelle et de rotation (ce qui m'a amené à essayer SIFT/SURF), mais je n'ai aucune idée de la manière de modifier la fonction de correspondance des modèles.
Quelqu'un a-t-il des suggestions sur la meilleure façon d'accomplir cette tâche ?