
OpenAI presenta herramienta de audio que lee textos e imita voces – Mundo Conectado

A Abierto AIempresa de referencia en el desarrollo de inteligencia artificial, presenta los resultados de un nuevo proyecto: una herramienta para audio capaz de leer textos en voz alta con un parecido sorprendente con la voz humana. La tecnología plantea avances significativos en el campo de la inteligencia artificial, pero también plantea interrogantes sobre posibles usos indebidos, como la creación de “deepfakes” (medios falsos).
La compañía ha estado compartiendo algunas pruebas iniciales con estas voces sintéticas, una característica llamada Voice Engine, que ya utilizan alrededor de 10 desarrolladores. Inicialmente, OpenAI planeó un lanzamiento más amplio, pero se echó atrás después de consultar con expertos, preocupado por los riesgos potenciales y el uso indebido, especialmente en el turbulento escenario electoral.
🚨 NOTICIAS DE ÚLTIMA HORA:
OpenAI acaba de lanzar Voice Engine,
Proporcione texto como entrada y una muestra de audio de 15 segundos para copiar la voz del hablante original.Suena increíblemente parecido 🤯
Sigue el 🧵 pic.twitter.com/CEUJtLbz8c
– Dios del pronto (@godofprompt) 29 de marzo de 2024
“Sabemos que generar voces idénticas a las del pueblo conlleva serios riesgos, y esto es aún más preocupante en un año electoral“, dijo la empresa en una nota. “Estamos colaborando con socios en los EE. UU. e internacionalmente en el gobierno, los medios de comunicación, el entretenimiento, la educación y la sociedad civil para garantizar que se escuchen sus inquietudes a medida que desarrollamos la herramienta.“
OpenAI intenta superar a la IA de audio rival
Ya se han utilizado tecnologías similares con fines dudosos. Un caso reciente de una llamada telefónica falsa pero increíblemente realista supuestamente realizada por el actual presidente de Estados Unidos animando a la gente a no votar en las primarias ha causado gran preocupación sobre el uso de la inteligencia artificial con fines nefastos.
A diferencia de los sistemas anteriores, Voice Engine de OpenAI puede generar voces que imitan entonaciones y ritmos muy específicos de individuos. Para reproducir la voz de alguien, la tecnología sólo necesita 15 segundos de una grabación de audio de esa persona.
Probamos Gen-2, la prometedora IA que crea videos con solo comandos de texto
En una demostración, los periodistas escucharon un discurso del CEO de OpenAI, Sam Altman, explicando su propia tecnología con una voz que era indistinguible de la real, pero completamente sintetizada.
“Si tienes un buen equipo de audio, básicamente tendrás una voz impecable.“, dice Jeff Harris, líder de producto de la empresa. “La calidad técnica es impresionante. Pero, por supuesto, existe una gran preocupación por la capacidad de reproducir el habla humana con tanta fidelidad.“
OpenAI ya ha estado trabajando con socios que utilizan la herramienta con fines positivos. Un ejemplo es el Instituto de Neurociencias Norman Prince, que utiliza tecnología para ayudar a los pacientes a recuperar su voz recreando su discurso a partir de grabaciones antiguas.
Windows 11 + ChatGPT: descubre Copilot, la inteligencia artificial dentro de tu ordenador
La tecnología genera interés de los socios
Gracias a su capacidad para traducir también audio, la tecnología resulta atractiva para empresas del sector, como Spotify, que la utiliza para traducir podcasts de presentadores famosos. Otra aplicación citada por OpenAI es la creación de diferentes voces para contenidos educativos infantiles.
En el programa de prueba, OpenAI exige a sus socios que acepten políticas de uso, obteniendo el consentimiento de las personas involucradas antes de reproducir sus voces y dejando siempre claro cuando la voz escuchada es artificial. La empresa también implementó una marca de agua inaudible para distinguir los audios creados por su herramienta.
Antes de una implementación más amplia, OpenAI quiere recopilar comentarios de expertos externos. “Es importante que la gente comprenda la dirección que va esta tecnología, ya sea que la lancemos o no.“, refuerza la empresa.
Fuente: Abierto AI