3 votes

API pour la conversion des données vocales/audio en texte

Je travaille sur une application iphone dans laquelle je stocke la voix des utilisateurs sous forme de fichier audio et je veux l'afficher en texte.

Comment cela se passera-t-il ? Une idée sur les API ?

Merci, Aaryan

3voto

Peter Elespuru Points 7211

Avez-vous vu Sphinx de la CMU ?

En particulier, sphinx de poche (écrit en C)

Alors qu'elle est davantage axée sur la reconnaissance, il a été utilisé pour la transcription avant Cela dépend donc de ce dont vous avez exactement besoin :

En outre, avez-vous envisagé une API non native/locale, c'est-à-dire un service web que vous pourriez appeler avec vos données vocales, ou tenez-vous absolument à une bibliothèque/API native ?

Par exemple, Ribbit dispose d'une plateforme pour ce genre de choses. et prend en charge la transcription de la voix en texte.

"Comment puis-je activer les transcriptions de la voix au texte ? Disponible en tant que service payant, les transcriptions voix-texte sont automatiquement disponibles via l'API Ribbit. Veuillez utiliser le crédit d'inscription gratuit de 25 $ pour essayer le service."

1voto

coneybeare Points 23802

Il existe une application qui le fait déjà : Jott . La façon dont ils le font est d'envoyer le fichier à des transcripteurs en Inde ! ( source )

0voto

LeonBrussels Points 1371

Vous devrez développer vous-même le moteur de reconnaissance vocale, j'en ai bien peur. Aucune bibliothèque à ma connaissance ne peut le faire. En outre, le processeur de l'iPhone ne serait probablement pas assez puissant.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X