57 votes

Reconnaissance de logo en images

Personne ne sait universitaires récentes travail qui a été fait sur le logo de la reconnaissance dans les images? Merci de répondre uniquement si vous êtes familier avec ce sujet (je peux faire une recherche Google pour "le logo" moi-même, merci beaucoup). Quelqu'un qui s'y connaît en la vision par ordinateur et a fait un travail sur la reconnaissance de l'objet est la bienvenue pour commentaire.

Mise à jour: Veuillez consulter les aspects algorithmiques (ce que l'approche que vous pensez est approprié, les papiers dans le champ, s'il doit travailler(et a été testé) pour les données du monde réel, les considérations d'efficacité) et non pas le côté technique (le langage de programmation utilisé, ou s'il est avec OpenCV...) Les travaux sur l'indexation d'images et de contenu en fonction de l'image de récupération, vous pouvez également aider.

39voto

Roman Shapovalov Points 1332

Vous pourriez essayer d'utiliser les fonctionnalités comme TAMISER ici: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

Il devrait fonctionner parce que le logo de forme est généralement constant, donc extrait les caractéristiques correspondent bien.

Le flux de travail va être comme ceci:

  1. Détecter les coins (par exemple, Harris coin détecteur) - pour le logo de Nike, ils sont deux extrémités pointues.

  2. Calculer des descripteurs (comme SIFT - 128D entier vecteur)

  3. Sur stage de formation en souviens; sur la mise en correspondance trouver des voisins les plus proches pour chaque entité dans la base de données obtenues au cours de la formation. Enfin, vous avez une série de matchs (certains d'entre eux sont probablement faux).

  4. De semences de mauvaises correspondances à l'aide de RANSAC. Ainsi vous aurez la matrice qui décrit la transformation de l'idéal de l'image du logo pour un site où vous trouvez le logo. Selon les paramètres, vous pourrez vous permettre de différents types de transformations (juste la traduction, la traduction et la rotation; la transformation affine).

Szeliski livre un chapitre (4.1) sur les particularités locales. http://research.microsoft.com/en-us/um/people/szeliski/Book/

P. S.

  1. Je suppose que vous voulez trouver des logos, de photos, par exemple trouver tous les panneaux publicitaires de Pepsi, de sorte qu'ils pourraient être faussées. Si vous avez besoin de trouver une chaîne de TÉLÉVISION du logo sur l'écran (de sorte qu'il n'est pas en rotation et mise à l'échelle), vous pourriez le faire plus facile (la correspondance de modèle ou de quelque chose).

  2. Classique EIPD ne considère pas les informations de couleur. Puisque les logos ont généralement des couleurs constantes (même si la couleur exacte dépend de la foudre et de la caméra), vous pourriez envisager de la couleur de l'information en quelque sorte.

31voto

Stefan Points 378

Nous avons travaillé sur le logo de détection/reconnaissance dans le monde réel des images. Nous avons également créé un jeu de données FlickrLogos-32 et mis à la disposition du public, y compris les données de réalité de terrain et de l'évaluation des scripts.

Dans notre travail, nous avons traité le logo de la reconnaissance en tant que problème de récupération de simplifier multi-classe de la reconnaissance et de permettre à de tels systèmes pour être facilement adaptable à de nombreux (par exemple, des milliers) logo de classes.

Récemment, nous avons développé un regroupement technique appelée Bundle min-Hachage qui regroupe les configurations spatiales de plusieurs caractéristiques locales en très caractéristique distinctive des bundles. Le bundle de la représentation est utilisable pour les deux d'extraction et de reconnaissance. Voir l'exemple suivant cartes de chaleur pour le logo de détections:

enter image description hereenter image description here

Vous trouverez plus de détails sur les opérations internes, les applications potentielles de l'approche, des expériences sur ses performances et bien sûr aussi de nombreuses références à des travaux connexes dans les documents [1][2].

14voto

Adi Shavit Points 4470

Jetez un coup d'œil au projet Unlogo . Il est open source et fonctionne dans le monde réel.

7voto

Marco Points 454

Travaillé sur: la Marque de correspondance et de récupération dans les sports en vidéo les bases de données obtenir une version PDF de l'article: http://scholar.google.it/scholar?cluster=9926471658203167449&hl=en&as_sdt=2000

Nous avons utilisé des EIPD à titre de marque de commerce et de l'image de descripteurs, et un seuil normalisé correspondant à calculer la distance entre les modèles et les images. Dans notre dernier travail, nous avons été en mesure de réduire considérablement le calcul à l'aide de méta-modèles, créés à l'évaluation de la pertinence de la douceur des points qui sont présents dans les différentes versions de la même marque.

Je dirais qu'en général, travailler avec des vidéos est plus difficile que de travailler sur les photos à cause de la très mauvaise qualité visuelle de la TÉLÉVISION normes actuellement utilisées.

Marco

4voto

sberry Points 28742

J'ai travaillé sur un projet où nous avons eu à faire quelque chose de très similaire. J'ai d'abord essayé à l'aide de Haar techniques de Formation à l'aide de ce logiciel

OpenCV

Il a travaillé, mais n'était pas une solution optimale pour nos besoins. Notre source d'images (où nous étions à la recherche pour le logo) ont une taille fixe et ne contient que le logo. De ce fait, nous avons été en mesure d'utiliser cvMatchShapes avec un bon match et de comparer la valeur retournée à considérer qu'un bon match.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X