ChatGPT, un modelo de lenguaje desarrollado por OpenAI, anuncia que está implementando nuevas funciones, incluida la capacidad de permitir a los usuarios entablar una conversación de voz con el chatbot.

Hasta ahora, solo se podía interactuar por escrito con las diferentes versiones de ChatGPT, pero pronto los usuarios podrán tener una conversación en vivo y escuchar las respuestas de la máquina. De esta manera, desde la empresa están implementando voz e imágenes en ChatGPT para los usuarios de Plus y Enterprise durante las próximas dos semanas. La voz llegará en iOS y Android (opt-in en su configuración) y las imágenes estarán disponibles en todas las plataformas.

La voz y la imagen ofrecen más formas de usar ChatGPT en nuestra vida. Podremos realizar una fotografía de un punto de referencia mientras viajamos y tener una conversación en vivo sobre lo que es interesante en aquella zona. Cuando estemos en casa, podremos tomar fotos de la nevera y despensa para averiguar qué hay para cenar (y hacer preguntas de seguimiento para una receta paso a paso).

¿Cómo utilizar esta capacidad de voz?

Para empezar con la voz, hay que dirigirse a configuración y luego hacer clic en nuevas funciones en la aplicación móvil, optando así por las conversaciones de voz. Tras esto, tocar el botón de auriculares ubicado en la esquina superior derecha de la pantalla de inicio y elegir la voz preferida entre cinco voces diferentes. Aunque la voz que viene por defecto es una voz que imita a la de una mujer joven, como suele ser habitual en este tipo de herramientas.

La nueva capacidad de voz está impulsada por un nuevo modelo de texto a voz, capaz de generar audio similar al humano a partir de solo texto y unos pocos segundos de muestra de voz. Para conseguirlo, han colaborado con actores de voz profesionales para crear cada una de las voces. También utilizan Whisper, su sistema de reconocimiento de voz de código abierto, para transcribir las palabras habladas en texto.

Por otro lado, Spotify está utilizando el poder de esta tecnología para el piloto de su función de traducción de voz, que ayuda a los podcasters a ampliar el alcance de su narración mediante la traducción de podcasts a idiomas adicionales en las propias voces de los podcasters.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

ÚLTIMOS POSTS

ÚLTIMOS POSTS

PUEDE INTERESARTE

¿CONECTAMOS?

POSTS MÁS COMENTADOS

Scroll al inicio
Email:*
Nombre:*
Apellidos:*
Empresa:*
Cargo:
Sector:
Teléfono:
Dirección postal:

Rellenar si se quiere recibir la revista física.
Acepto recibir la newsletter y comunicaciones de Ecommerce News conforme a la Política de Privacidad:
Acepto recibir comunicaciones comerciales de terceros:
Resumen de privacidad

Las cookies y otras tecnologías similares son una parte esencial de cómo funciona nuestra web. El objetivo principal de las cookies es que tu experiencia de navegación sea más cómoda y eficiente y poder mejorar nuestros servicios y la propia web. Aquí podrás obtener toda la información sobre las cookies que utilizamos y podrás activar y/o desactivar las mismas de acuerdo con tus preferencias, salvo aquellas Cookies que son estrictamente necesarias para el funcionamiento de la web de eCommerce News. Ten en cuenta que el bloqueo de algunas cookies puede afectar tu experiencia en la web y el funcionamiento de la misma. Al pulsar “Guardar cambios”, se guardará la selección de cookies que has realizado. Si no has seleccionado ninguna opción, pulsar este botón equivaldrá a rechazar todas las cookies. Para más información puedes visitar nuestra Políticas de Cookies. Podrás cambiar en cualquier momento tus preferencias de cookies pinchando en el enlace “Preferencias de cookies” situado en la parte inferior de nuestra web.