General

Esta nueva tecnología de síntesis de voz puede falsificar la voz de cualquier persona


Con el rápido desarrollo en la construcción de robots similares a los humanos, el próximo paso previsible en esta era de la inteligencia artificial es emparejarlos con voces de la vida real. Y eso es exactamente lo que ha hecho esta start-up con sede en Montreal al presentar la primera tecnología de síntesis de voz del mundo que puede reproducir la voz de cualquier persona. ¡Cuidado con Siri y Alexa, es posible que pronto te consideren obsoleto!

[Fuente de imagen: Pixabay]

¿Como funciona?

Lyrebird, fundada por tres Ph.D. estudiantes de la Universidad de Montreal, ha desarrollado una solución de síntesis de voz que es capaz de copiar exactamente la voz de alguien con una emoción determinada.

La síntesis hace esto analizando solo unas pocas docenas de segundos de grabación de audio. Al grabar un minuto de la voz de alguien, Lyrebird puede comprimir el ADN de audio de esa persona en una clave única. El generador de voz de IA puede entonces producir cualquier discurso con su rango vocal correspondiente. Si no quiere falsificar la voz de alguien que conoce o usar la suya propia, puede diseñar una voz única para usar en su aplicación. También hay una amplia gama de selección entre miles de voces predefinidas entre las que puede elegir. Por supuesto, todo el generador de voz de IA no sería tan especial si fuera monótono como las voces digitales actuales. El generador vocal sintético de Lyrebird puede controlar la emoción de las voces generadas dándoles ira, simpatía, estrés y muchas más expresiones humanas. Pero lo más destacado de este nuevo generador de voz digital es su capacidad para producir 1.000 frases en menos de medio segundo. Esto coloca la tecnología de Lyrebird a la vanguardia de la síntesis de voz de IA.

Uno de los cofundadores de Lyrebird, Alexandre de Brébisson, habló sobre cómo su tecnología recientemente desarrollada no requiere tanta información para generar voces de igual a igual.

"Diferentes voces comparten mucha información. Después de haber aprendido las voces de varios oradores, aprender la voz de un orador completamente nuevo es mucho más rápido. Es por eso que no necesitamos tantos datos para aprender una voz completamente nueva. Más datos definitivamente ayudarán , sin embargo, un minuto es suficiente para capturar gran parte del ADN de la voz ".

La API que se está desarrollando será robusta para aprender incluso de grabaciones ruidosas. La versión actual de la tecnología utiliza varias entonaciones de la voz de una persona, como esta generó grabaciones vocales de Donald Trump.

Cuestiones éticas

Muchos estudios de investigación inevitablemente se enfrentan a críticas éticas y a menudo se les cuestiona sobre el uso previsto de sus hallazgos. La síntesis de voz de Lyrebird se enfrenta a algunos problemas éticos, como el robo de identidad, ya que solo se requiere una grabación de audio muy corta para reproducir la voz de alguien. Especialmente si el generador de voz se lanza al público, será difícil de controlar una vez que millones de personas tengan acceso a la tecnología. Además, las pruebas de grabación de voz en casos penales también pueden invalidarse, ya que se puede argumentar que el archivo de audio está falsificado o ha sido manipulado.

Sin embargo, este no es el propósito de esta síntesis de voz. Los fundadores de Lyrebird buscan aplicar la tecnología de manera positiva como una ayuda personal como para leer libros con voces famosas. También está dirigido a personas con discapacidades que pueden usar la síntesis de voz para ayudarlos a hablar. Un ejemplo famoso de esto es la voz de computadora que usa Stephen Hawking. Además, la tecnología también se puede utilizar ampliamente en películas de animación y estudios de videojuegos.

La tecnología de Lyrebird aún se está desarrollando, sin embargo, las personas interesadas pueden suscribirse al sitio web de la startup para convertirse en un beta-tester o recibir información sobre el lanzamiento.

VíaAve lira

VEA TAMBIÉN: Este dispositivo cerebro-computadora da voz a aquellos que no pueden hablar


Ver el vídeo: Telefono habla se forma un cuadro verde alrededor de la aplicacion Solucion para LG Phoenix 3 att (Diciembre 2021).