Buscar
Cerrar este cuadro de búsqueda.

OpenAI ya tiene una IA capaz de clonar la voz

OpenAI está perfeccionando su tecnología Voice Engine para clonar la voz. Esta expansión de la API de conversión de texto a voz existente de la compañía, que lleva aproximadamente dos años en desarrollo, permite a los usuarios cargar una muestra de voz de 15 segundos para generar una copia de esa voz.

El desarrollo de esta herramienta por parte de OpenAI comenzó a finales de 2022 y fue empleada inicialmente para generar la voz de su API de texto a voz, ChatGPT Voice y Read Aloud. Posteriormente, se implementó para crear la voz de ChatGPT en las aplicaciones móviles. A lo largo de 2023, un pequeño grupo ha estado utilizando esta herramienta para explorar posibles casos de uso, y ahora han compartido algunos de los resultados, aunque no han anunciado la fecha en la que estará disponible para el público.

«Esperamos iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades. Con base en estas conversaciones y los resultados de estas pruebas a pequeña escala, tomaremos una decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo» anunciaron en su blog.

¿Cuáles son los usos de Voice Engine?

En el blog de OpenAI han compartido algunos de los desarrollos que han realizado junto con sus partners. El primero de ellos ha sido con Age of Learning, una empresa de tecnología educativa enfocada en el éxito académico de los niños, ha utilizado la tecnología para proporcionar asistencia de lectura a niños y personas no lectoras mediante voces emotivas que suenan naturales y representan una diversidad más amplia de hablantes que lo que es posible con voces predefinidas. Con GPT-4 han desarrollado respuestas personalizadas en tiempo real para interactuar con los estudiantes.

Otra de las pruebas que han realizado es con la plataforma HeyGen, que se dedica a la traducción de contenido, como vídeos y pódcast, para que los creadores y las empresas puedan alcanzar a un público más amplio en todo el mundo, manteniendo la fluidez y la autenticidad de sus propias voces. Colabora estrechamente con sus clientes empresariales en la creación de avatares personalizados con apariencia humana para una variedad de contenidos, desde marketing de productos hasta demostraciones de ventas. HeyGen ha empleado el Voice Engine para llevar a cabo la traducción de videos, permitiendo así la traducción de la voz de un orador a varios idiomas y llegando así a una audiencia global. Una característica distintiva del Voice Engine es que, al realizar la traducción, conserva el acento nativo del hablante original; por ejemplo, al generar inglés a partir de una muestra de audio de un hablante francés, el habla resultante conservará el acento francés.

También han trabajado con Dimagi, empresa que ofrece servicios en entornos remotos con el objetivo de alcanzar comunidades globales. La empresa está desarrollando herramientas para que los trabajadores de salud comunitarios puedan ofrecer una amplia gama de servicios esenciales, como asesoramiento para madres lactantes. Para ayudar a estos trabajadores a mejorar sus habilidades, Dimagi utiliza Voice Engine y GPT-4 para proporcionar retroalimentación interactiva en el idioma principal de cada trabajador, lo que incluye el suajili o idiomas más informales como el sheng, un lenguaje de código mixto popular en Kenia.

Además, de compartir algunos de los usos que tendrá la herramienta de voz de OpenAi, también han aprovechado el comunicado para señalar que «creemos que cualquier implementación amplia de tecnología de voz sintética debe ir acompañada de experiencias de autenticación de voz que verifiquen que el hablante original está agregando conscientemente su voz al servicio y una lista de voces prohibidas que detecte y evite la creación de voces que sean demasiado similares a figuras destacadas«.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

ÚLTIMOS POSTS

ÚLTIMOS POSTS

PUEDE INTERESARTE

¿CONECTAMOS?

POSTS MÁS COMENTADOS

Scroll al inicio
Email:*
Nombre:*
Apellidos:*
Empresa:*
Cargo:
Sector:
Teléfono:
Dirección postal:

Rellenar si se quiere recibir la revista física.
Acepto recibir la newsletter y comunicaciones de Ecommerce News conforme a la Política de Privacidad:
Acepto recibir comunicaciones comerciales de terceros: