55 votes

Java: du Texte à la Parole des moteurs de présentation

Je suis maintenant dans une recherche de Java Text to Speech (TTS) cadre. Au cours de mes enquêtes, j'ai trouvé plusieurs JSAPI1.0-(partiellement)-compatible cadres répertoriés sur JSAPI Implémentations de la page, ainsi que d'une paire de Java TTS cadres qui ne semble pas suivre JSAPI spec (Marie, Disent-Il-Maintenant). J'ai également noté que pas actuellement de référence de mise en œuvre, pour JSAPI.

Bref tests que j'ai fait pour FreeTTS (premier de la liste dans JSAPI impls page) montrent que c'est loin de lecture simple et évident des mots (exemple: ABC, blackboard). D'autres tests sont actuellement en cours.

Et voici la question (6, en fait):

  1. Qui de Java TTS cadres avez-vous utilisé?
  2. Ceux qui, à votre avis, sont capables de lire le plus grand wordbase?
  3. Qu'en leur qualité de voix?
  4. Quelles sont leurs performances?
  5. Non la liste des frameworks Java avec Java liaisons sont là sur la scène?
  6. Qui recommanderiez-vous?

Merci d'avance pour vos commentaires et vos suggestions.

19voto

pfranza Points 1504

En fait, j'ai eu d'assez bonne chance avec FreeTTS

12voto

nvrandow Points 161

5voto

James Schek Points 11070

J'ai utilisé AT&T Natural Voices qui fournit JSAPI et MS SAPI crochets. Il offre une excellente qualité de voix, un bon "général" de la parole de dictionnaire, de nombreux contrôles sur la prononciation, et de plusieurs langues. C'est un peu cher, mais fonctionne très bien.

Je l'ai utilisé pour lire les importantes capteur de télémétrie, pour que les conducteurs de détection mobile de l'application. On n'avait pas de plaintes au sujet de la qualité de la voix. Il y avait environ 75% de dehors-de-le-boîte de précision avec des termes scientifiques, et beaucoup plus (peut-être 90%+) avec la normale de dialogue. Nous avons eu jusqu'à environ 99+% précision en utilisant des balises (la plupart des erreurs ont été sur le plan scientifique avec des combinaisons de phonèmes).

C'était un peu dur sur le processeur (nous avons été en cours d'exécution sur un processeur Pentium III équivalent de la machine et il poussait de 50% à 75% maximum du CPU). Il utilise un discours indigène engine (Windows, Linux, et Mac compatible) avec une interface Java.

Il existe une grande variété de voix et de langues...

1voto

DiaWorD Points 263

Merci beaucoup tout le monde, le truc, c'est FreeTTS source. En bref: si en cours d'exécution comme "java -jar freetts.jar certains-plus-args-ici", c'sorts moins de mots que lors de l'exécution, en une manière de bin/Server.jar et bin/Client.jar.

Merci à tous encore une fois!

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X