Je souhaite créer une application Android qui, via une bibliothèque OCR, devrait numériser une image en extrayant du texte.
Quelle bibliothèque Java devrais-je utiliser?
Je souhaite créer une application Android qui, via une bibliothèque OCR, devrait numériser une image en extrayant du texte.
Quelle bibliothèque Java devrais-je utiliser?
Je ne sais pas à quel point c'est bon (il faut absolument le former au préalable), mais il y a la bibliothèque Java OCR de Ron Cemer .
Si vous êtes à la recherche d'un très extensible option ou ont un problème spécifique de domaine, vous pourriez envisager de déployer votre propre en utilisant le Java Orienté Objet de Neurones Moteurs.
Je l'ai utilisé avec succès dans un projet personnel, pour identifier la lettre à partir d'une image comme cela, vous pouvez trouver toutes les sources pour l'OCR composante de mon application sur github, ici.
essayez de tesseract, checkout cet article http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html et cet exemple http://code.google.com/p/mezzofanti/
Edit: certains plus de faits - tesseract est l'un des meilleurs OCR open source utilisé par google - il y a un entraînement de données disponibles pour de nombreuses langues - mezzofanti est une application android qui utilise tesseract - méfiez-vous: l'OCR ne utiliser beaucoup de puissance CPU. en essayant de reconnaître une page A4 avec votre T-Mob G1 va prendre beaucoup de temps et le résultat peut ne pas vous impressionner ;-)
Vous pouvez utiliser la fonctionnalité OCR de Google Docs. Consultez l' API de données de liste de documents http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR.
Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.