92 votes

Comment résoudre une TesseractNotFoundError?

Je essaie d'utiliser pytesseract en Python mais je finis toujours par obtenir l'erreur suivante :

    raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract n'est pas installé ou n'est pas dans votre chemin

Cependant, pytesseract et Tesseract sont installés sur mon système.

Code d'exemple qui produit cette erreur :

import cv2
import pytesseract

img = cv2.imread('1d.png')
print(pytesseract.image_to_string(img))

Comment puis-je résoudre cette TesseractNotFoundError?

0 votes

Même problème rencontré pour AWS lambda

115voto

Ali Points 504

J'ai obtenu cette erreur car j'ai installé pytesseract avec pip mais j'ai oublié d'installer le binaire.

Sous Linux

sudo apt update
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev

Sous Mac

brew install tesseract

Sous Windows

téléchargez le binaire depuis https://github.com/UB-Mannheim/tesseract/wiki. puis ajoutez pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe' à votre script. (remplacez le chemin du binaire tesseract si nécessaire)

références: https://pypi.org/project/pytesseract/ (section INSTALLATION) et https://github.com/tesseract-ocr/tesseract/wiki#installation

5 votes

Pour Windows 64 bits, ajoutez pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'

2 votes

BOOM! Bien joué monsieur donnez-lui un cookie!

0 votes

Oui. C'est exactement ce que je cherchais.

53voto

Ben Hooper Points 441

J'ai essayé d'ajouter à la variable de chemin comme d'autres l'ont mentionné, mais j'ai quand même reçu la même erreur. Ce qui a fonctionné était d'ajouter ceci à mon script:

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe"

0 votes

Peut-être avez-vous installé la version 64 bits, veuillez vérifier le chemin ci-dessous si vous avez 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'. Au cas où tesseract serait disponible, changez cette ligne comme suit pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'

20voto

KornholioBeavis Points 1031

Vous manquez probablement de tesseract-ocr sur votre machine. Vérifiez les instructions d'installation ici : https://github.com/tesseract-ocr/tesseract/wiki

Sur un Mac, vous pouvez simplement l'installer en utilisant homebrew :

brew install tesseract

Cela devrait fonctionner correctement après cela

16voto

ahbon Points 711

Sous l'environnement du système d'exploitation Windows 10, la méthode suivante fonctionne pour moi :

  1. https://github.com/tesseract-ocr/tesseract/wiki Téléchargez Tesseract et installez-le. La version Windows est disponible ici : https://github.com/UB-Mannheim/tesseract/wiki

  2. Trouvez le fichier de script pytesseract.py dans C:\Users\User\Anaconda3\Lib\site-packages\pytesseract et ouvrez-le. Modifiez le code suivant de tesseract_cmd = 'tesseract' à : tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

  3. Vous devrez peut-être également ajouter la variable d'environnement D:/Program Files (x86)/Tesseract-OCR/

En espérant que cela fonctionne pour vous !

10voto

evanca Points 81

Une chose simple qui a réellement fonctionné pour moi dans Jupyter Notebook, était d'utiliser deux backslashes au lieu d'un seul backslash dans le chemin pytesseract.pytesseract.tesseract_cmd :

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X