83 votes

Limiter les caractères recherchés par tesseract

Est-il possible de limiter le jeu de caractères recherché par tesseract (par exemple, rechercher uniquement les lettres az)? Cela améliorerait considérablement mes résultats.

91voto

Blomman Points 296

Créez un fichier de configuration (par exemple "lettres") dans le répertoire tessdata / configs - généralement /usr/share/tesseract/tessdata/configs
ou
/usr/share/tesseract-ocr/tessdata/configs

Et ajoutez cette ligne au fichier de configuration:

 tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz  
 

... ou peut-être que [az] fonctionne .. ne sais pas :-)
Appelez ensuite tesseract comme ceci:

 tesseract input.tif output nobatch letters  
 

Cela limitera le tesseract à reconnaître uniquement les personnages recherchés

2voto

Buzzy Points 924

Ce didacticiel détaille les étapes nécessaires à la formation de Tesseract. Je l'ai trouvé très utile.

0voto

epatel Points 32451

Vous devriez probablement envisager de préparer certains fichiers de formation. Jetez un œil à cet outil

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X