OpenAI ha dado un paso más en la evolución de la interacción con inteligencia artificial al llevar el Modo Avanzado de Voz de ChatGPT a los navegadores web. Ahora, los usuarios podrán mantener conversaciones habladas con el chatbot directamente desde su navegador. El anuncio fue realizado por Kevin Weil, director de producto de la compañía, a través de la plataforma X (anteriormente Twitter).
Esta funcionalidad, que permite una interacción más natural y fluida con ChatGPT, estará disponible inicialmente para los usuarios de pago. Esto incluye a los suscriptores de los planes Plus, Enterprise, Teams y Edu, quienes podrán comenzar a probarla a lo largo de esta semana.
El lanzamiento en la web sigue a la introducción del Modo Avanzado de Voz en las aplicaciones de iOS y Android en septiembre. Gracias a las capacidades nativas de audio del modelo GPT-4, este modo permite conversaciones en tiempo real en las que ChatGPT puede entender aspectos no verbales como la velocidad de habla y responder con expresiones emocionales.
¿Cómo funciona en la web?
Para comenzar una conversación por voz, solo necesitas hacer clic en el ícono de Voz ubicado en la esquina inferior derecha de la ventana de ChatGPT. Después, se requerirá tu permiso para que el navegador acceda al micrófono. Al iniciar, verás una pantalla con un orbe azul al centro, el cual marca el estado de la interacción por voz.
El usuario puede elegir entre nueve voces diferentes, cada una con su propio tono y personalidad. Por ejemplo, “Arbor” se describe como “relajado y versátil,” mientras que “Ember” es “seguro y optimista.”
¿Qué viene después?
Según Weil, la compañía tiene planes de extender esta funcionalidad a los usuarios gratuitos en las próximas semanas. Por ahora, los suscriptores de Plus y Teams tendrán un límite diario para usar el Modo Avanzado de Voz, el cual varía y será notificado con anticipación. Los usuarios gratuitos podrán acceder a una vista previa mensual para experimentar esta nueva característica.
Este avance no solo facilita la interacción con la inteligencia artificial, sino que marca un paso hacia la humanización de estas tecnologías. El Modo Avanzado de Voz promete abrir nuevas puertas para la accesibilidad y la personalización, llevando la experiencia del usuario a otro nivel.