Existe-t-il des bibliothèques OCR gratuites qui fonctionnent avec PHP ou Python sur un serveur Linux ? L'idée est de pouvoir télécharger une image et d'en extraire des caractères, ou de permettre aux utilisateurs de "dessiner des caractères" et de les analyser à partir de ladite image.
Réponses
Trop de publicités?Puisque vous êtes sur une boîte Linux, je recommande fortement le projet open source de Google ocropus .
Ce n'est pas PHP, mais je pense que ce sera votre meilleure option. Bien sûr, vous pouvez l'appeler à partir de PHP via exec
. Il est mature et possède de nombreuses options. Depuis le site du projet :
Le moteur d'OCRopus est basé sur deux projets de recherche : un système de reconnaissance de l'écriture manuscrite très performant développé au milieu des années 90 et déployé par le bureau de recensement américain, et de nouvelles méthodes d'analyse de la mise en page très performantes.
Il existe également un autre projet open source, tesseract . Je l'ai également utilisé dans le passé et j'ai été satisfait des résultats. Comprend la formation, la limitation de votre alphabet, etc.
Avez-vous vu les cours phpOCR d'Andrey Kucherenko ? http://www.phpclasses.org/package/2874-PHP-Recognize-text-objects-in-graphical-images.html C'est un vieil article mais il peut vous aider.