41 votes

Quel type de bibliothèque OCR Java dois-je utiliser dans Android?

Je souhaite créer une application Android qui, via une bibliothèque OCR, devrait numériser une image en extrayant du texte.

Quelle bibliothèque Java devrais-je utiliser?

21voto

Thilo Points 108673

Je ne sais pas à quel point c'est bon (il faut absolument le former au préalable), mais il y a la bibliothèque Java OCR de Ron Cemer .

7voto

dukedave Points 3496

Si vous êtes à la recherche d'un très extensible option ou ont un problème spécifique de domaine, vous pourriez envisager de déployer votre propre en utilisant le Java Orienté Objet de Neurones Moteurs.

Je l'ai utilisé avec succès dans un projet personnel, pour identifier la lettre à partir d'une image comme cela, vous pouvez trouver toutes les sources pour l'OCR composante de mon application sur github, ici.

6voto

raudi Points 680

essayez de tesseract, checkout cet article http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html et cet exemple http://code.google.com/p/mezzofanti/

Edit: certains plus de faits - tesseract est l'un des meilleurs OCR open source utilisé par google - il y a un entraînement de données disponibles pour de nombreuses langues - mezzofanti est une application android qui utilise tesseract - méfiez-vous: l'OCR ne utiliser beaucoup de puissance CPU. en essayant de reconnaître une page A4 avec votre T-Mob G1 va prendre beaucoup de temps et le résultat peut ne pas vous impressionner ;-)

0voto

yeradis Points 1911

Vous pouvez utiliser la fonctionnalité OCR de Google Docs. Consultez l' API de données de liste de documents http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X