J'ai récemment découvert Tesseract y OpenCV . Il semble que Tesseract soit un moteur d'OCR à part entière et qu'OpenCV puisse être utilisé comme cadre pour créer une application/service d'OCR.
J'ai essayé d'utiliser Tesseract sur certaines de mes images et sa précision semble correcte. Plus tard, je suis tombé sur un tutoriel sur l'utilisation d'OpenCV pour faire de l'OCR avec Python et j'ai été impressionné. En quelques minutes, j'ai fini d'entraîner le système et sa précision était bonne. Mais bien sûr, cette approche signifie que je dois entraîner mon système de manière intensive en utilisant un grand ensemble d'entraînement.
Mes questions spécifiques sont les suivantes :
- Comment choisir entre Tesseract et l'utilisation d'OpenCV pour créer une application OCR personnalisée ?
- Des ensembles de données de formation sont disponibles pour Tesseract dans différentes langues. OpenCV a-t-il quelque chose de similaire pour que je n'aie pas à partir de zéro pour réaliser l'OCR ?
- Laquelle est la meilleure pour une application commerciale ?
Des suggestions ?
8 votes
Les réponses ci-dessous sont vraiment excellentes, mais en tant qu'utilisateur d'OCR, je peux vous dire que la qualité de reconnaissance de Tesseract est inférieure aux attentes d'un utilisateur d'application commerciale. Tesseract est excellent, mais l'OCR est difficile - des choses comme la formation en ligne, ou des améliorations à la volée sont hmmm... encore à l'état de recherche. Google, le grand sponsor de TS ces derniers temps, a décidé de construire son propre moteur - OCROpus. Et bien qu'il ait promis de l'ouvrir, le moteur de reconnaissance de base n'est pas encore disponible - ils n'ont publié qu'un cadre - c'est une API pour tesseract.
3 votes
@vasile : C'est très instructif. Je ne connaissais pas OCROpus. Je vous remercie. Avez-vous des suggestions d'alternatives si mon objectif final est d'écrire une carte de visite OCR (ou disons, une carte qui lit les reçus des stations-service comme celle que j'ai mise en lien : upload.wikimedia.org/wikipedia/fr/3/34/ ) ? Je pose la question parce que je suis curieux de savoir ce que les nombreuses applications mobiles utilisent pour y parvenir. Cela ne me dérange pas de faire l'OCR du côté du serveur. J'ai été tenté d'utiliser OpenCV après avoir vu cette belle démo : youtube.com/watch?v=OkcOfS1lTxs
6 votes
Il existe un certain nombre de moteurs OCR commerciaux, il suffit de consulter Google.
OCR accuracy tests
et vous trouverez des graphiques. Quant aux applications mobiles, la plupart d'entre elles utilisent Tesseract. Mais si vous prenez la peine de télécharger certaines d'entre elles, vous verrez que les résultats sont un peu différents des promesses. Ils font généralement une vidéo de démonstration dans un environnement soigneusement contrôlé et la postent sur youtube, mais dans la nature, si vous scannez une page, une recette, une carte ou autre, vous obtiendrez de drôles de résultats.1 votes
@vasile : Merci. De quoi m'occuper pour ce soir. J'apprécie vraiment votre temps.