Voxygen, pour de la synthèse vocale dans vos livres numériques
Voxygen est une jeune start-up de deux ans, spécialisée dans la synthèse vocale. Appartenant au préalable à Orange, elle s’appuie sur une technologie de plus de quinze ans. Aude Garnier, ingénieure commerciale et Alain Richer, responsable du secteur de l’édition chez Voxygen, ont accepté de nous présenter les services qu’offre Voxygen aux éditeurs dans le cadre de ce dossier spécial son et numérique.
Lorsqu’on pense à la synthèse vocale, on pense à la robotique. Mais la technologie a très fort évolué ces dernières années et propose de nouvelles possibilités pour l’édition. Voxygen collabore avec des narrateurs et des comédiens pour que les enregistrements rendent le naturel et l’expressivité d’une voix humaine, en travaillant notamment sur le timbre et l’intonation. Pour arriver à un tel résultat, les narrateurs sont coachés et plusieurs enregistrements sont nécessaires. De cette manière, les scripts élaborés par les linguistes permettent de recomposer différents tons puisque le moteur de synthèse réagit notamment à la ponctuation.
Que peut apporter Voxygen aux éditeurs ?
En plus de travailler avec de très grandes sociétés actives dans des domaines très divers, Voxygen est également actif dans le domaine de l’édition numérique. En intégrant de la synthèse vocale dans un livre numérique, les éditeurs peuvent proposer à leurs lecteurs de suivre la lecture ou de vocaliser une narration. Pour ce faire, une équipe d’ingénieurs travaillent en collaboration avec les éditeurs pour déterminer quelles sont les solutions qui conviennent le mieux à leurs projets éditoriaux. Cette vocalisation s’accompagne d’une vraie éditorialisation car il faut entre autres déterminer les intonations et les voix en fonction des personnages.
Sur quels genres de projets éditoriaux travaillez-vous pour le moment ?
Nous avons commencé par travailler sur des projets éducatifs avec des voix très pédagogiques aux timbres très clairs pour que l’enfant puisse bien intégrer l’information. Pour le moment, le marché de l’expressivité des voix est encore relativement neuf. En quelques années, nous avons énormément progressé en passant de voix de robot à des voix beaucoup plus expressives. Nous travaillons également sur des projets avec des textes relativement courts comme des contes ou des nouvelles, car cela prend beaucoup de temps de travailler les textes. Il s’agit d’une véritable technologie complémentaire au travail éditorial qu’il faut continuer à positionner pour la faire connaitre.
Par ailleurs, nous élaborons également d’autres contenus pour les éditeurs qu’ils peuvent utiliser comme outils marketing, comme par exemple des speechs de héros, à l’instar de prototypes que nous avons faits avec certaines maisons d’édition. Des fichiers sonores ont été élaborés pour que les fans reçoivent un message vocal de la part de leur héros leur annonçant la parution d’un nouvel album par exemple.
À quel type de maisons d’édition s’adresse votre offre ?
Nous travaillons surtout pour le moment avec des petites maisons d’édition qui veulent se démarquer pendant que les grands groupes reviennent doucement de leurs expériences passées. C’est en tous cas une technologie accessible à tout éditeur car nous nous adaptons à leur modèle économique. Vous pourrez voir dès septembre les projets sur lesquels nous travaillons actuellement.
À lire dans notre numéro spécial Son et numérique :
- Aux frontières des mots et de l’espace
- Littérature pour la jeunesse à écouter
- À chaque livre sa playlist
- La bibliothèque en ligne de la Ligue Braille : des livres audio à portée de clic
Retrouvez Lettres Numériques sur Twitter et Facebook.
— Stéphanie Michaux