General

Esta nueva tecnología permite editar audio como texto


Los ingenieros de la Universidad de Princeton han desarrollado Photoshop para la edición de audio. Está siendo anunciado como copiar y pegar el sonido. Este nuevo software puede agregar palabras o reemplazar palabras en la grabación de audio de una voz humana.

[Fuente de imagen: Pixabay]

Los ingenieros de audio han podido eliminar fragmentos de sonido editando la transcripción del clip durante varios años. Sin embargo, nunca han podido agregar o reemplazar una palabra por claridad. Este nuevo software, VoCo, sintetiza las nuevas palabras en la voz del hablante con facilidad, incluso si esa palabra no aparece en ninguna otra parte de la grabación.

"VoCo automatiza el proceso de búsqueda y unión, y produce resultados que normalmente suenan incluso mejor que los creados manualmente por expertos en audio", dijo Adam Finkelstein. Finkelstein se desempeña como profesor de informática en Princeton.

Como funciona el software

El software utiliza un algoritmo que escanea toda la grabación y junta una combinación de sonidos de palabras. Esos sonidos, llamados fonemas, culminan en la nueva palabra en la voz original. El algoritmo incluso se adapta a la ubicación de la palabra en una oración. Toma en cuenta el contexto de la palabra y agrega el énfasis apropiado.

"VoCo ofrece un vistazo a una tecnología muy práctica para editar pistas de audio, pero también es un presagio de tecnologías futuras que permitirán que la voz humana se sintetice y automatice de manera notable", dijo Finkelstein.

De hecho, varias personas ya se han acercado a los ingenieros para ayudarlos a recuperar la voz. El estudiante de posgrado Zeyu Jin presentará la investigación en julio. Jin señaló que el software VoCo podría dar voz a los que no la tienen.

"Se nos acercó un hombre que tiene una enfermedad neurodegenerativa y sólo puede hablar a través de un sistema de texto al habla controlado por sus párpados", dijo Jin. "La voz suena robótica, como el sistema utilizado por Steven Hawking, pero quiere que su pequeña hija escuche su voz real. Algún día podría ser posible analizar grabaciones pasadas de él hablando y crear un dispositivo de asistencia que habla con su propia voz. . "

Preguntas éticas

La tecnología también plantea algunas cuestiones éticas interesantes. Los investigadores reconocen esto y quieren abordar cualquier problema posible.

"Hoy damos por sentado que las fotos se pueden editar y juzgamos las fotos con un poco más de escepticismo", dijo Finkelstein. "Entendemos que las fotos tienen una responsabilidad periodística".

¿Se permitiría esto en los clips de noticias para agregar palabras que a menudo faltan como "a", "y" y "el"? A veces, esas palabras se pueden agregar al texto en aras de la claridad. Sin embargo, pueden cambiar el significado completo de una declaración. Por ejemplo, Neil Armstrong pretendía decir "Un pequeño paso para un hombre" en lugar de "Un pequeño paso para el hombre". ¿Cómo podría esta tecnología afectar la forma en que escuchamos y recordamos los clips de audio? Una pregunta aún más paranoica podría referirse a la verdad en general. En una era en la que los hechos se vuelven subjetivos, ¿se podría culpar a la existencia de esta tecnología de distorsionar la verdad?

Por ahora, el equipo de ingeniería anticipa una discusión más amplia sobre los usos del software.

"Es casi seguro que esta herramienta alimentará la conversación sobre audio que fue precedida por una conversación sobre fotos", dijo Finkelstein. "Muy pronto, será seguido por una conversación sobre video".

El proyecto de investigación completo se puede encontrar en la revista Transacciones en gráficos. Puede leer más sobre el proyecto en la preimpresión del documento en el sitio web de Princeton.

VEA TAMBIÉN: Este pequeño dispositivo puede convertir el aire contaminado en combustible de hidrógeno


Ver el vídeo: 20012021 EDUPOL MUNDO DIGITAL EXCEL1 (Diciembre 2021).