Translatotron de Google traduit la parole directement en parole

Camaractu

15 mai 2019

Translatotron ignore l'étape habituelle de traduction de la parole en texte, puis de nouveau.

James Martin / Camaraderielimited

Google a annoncé Translatotron, un "nouveau système expérimental" qui traduirait la parole directement en parole, supprimant ainsi le besoin de texte.

"Translatotron est le premier modèle de bout en bout capable de traduire directement le discours d'une langue en une langue dans une autre langue", a déclaré mercredi un article du blog de Google AI.

Selon Google, les systèmes de traduction actuels comportent trois étapes: la reconnaissance automatique de la parole, qui transcrit la parole sous forme de texte; la traduction automatique, qui traduit ce texte dans une autre langue; et synthèse de texte à parole, qui utilise ce texte pour générer de la parole.

En cascade, ces étapes ont abouti à des services tels que Google Translate, mais le géant de la technologie affirme désormais qu’il utilisera un seul modèle sans avoir besoin de texte.

"Surnommé Translatotron, ce système évite de diviser la tâche en plusieurs étapes", explique le blog des ingénieurs de Google AI, Ye Jia et Ron Weiss.

Cela signifie une vitesse de traduction plus rapide et des erreurs moins complexes, selon Google.

Le système utilise les spectrogrammes en entrée et génère des spectrogrammes, qui reposent également sur un vocodeur neural et un encodeur de haut-parleur, ce qui signifie que le système conserve les caractéristiques vocales du locuteur une fois traduit.

Laisser un commentaire