Deepmind, la inteligencia artificial de Google, habla como un humano

Deepmind, la inteligencia artificial de Google, es capaz de jugar al Go y a videojuegos, de escribir poesía, de ayudar en la predicción de enfermedades y ahora también de hablar como cualquier ser humanos gracias a WaveNet.

WaveNet es un modelo de generación de ondas de audio sin procesar, capaz de generar un discurso que simula la voz del ser humano. Para ello, la red neuronal ha sido entrenada con grabaciones reales procedentes de hablantes humanos.

La generación del discurso en WaveNet empezaba con la transformación de un texto en información sobre sus fonemas, sílabas y palabras, que se unían a los ejemplos de audio reales con el fin de avanzar en la predicción. El texto permite que el discurso sea más preciso.

Deepmind también ha sido entrenado para distinguir si el hablante es hombre o mujer y, en consecuencia, ser capaz de cambiar de identidad, o para expresar distintas emociones, con el objetivo de que el discurso sea más diverso.

Es programa va un paso más allá respecto a otros sistemas, como los de reconocimiento de voz o los que convierten un texto en audio. WaveNet genera un sonido más similar al del ser humano, hasta el punto de reducir la brecha con el desempeño humano en un 50%, según han explicado en la web del proyecto de Deepmind.

Fuente: Innovaticias