OpenAI presenta GPT-4o: Un nuevo avance en inteligencia artificial con capacidades omnidireccionales

La destacada firma de tecnología OpenAI ha lanzado al mercado su último avance en inteligencia artificial, denominado GPT-4o, con la «o» haciendo referencia a su capacidad «omni» para manejar texto, voz y video en tiempo real. Este modelo promete una mejora significativa en velocidad, rendimiento y funcionalidades, representando un paso hacia una interacción más natural entre humanos y computadoras.

Según explican desde OpenAI, GPT-4o puede procesar cualquier combinación de texto, audio e imagen como entrada de información, generando a su vez cualquier combinación de salidas en esos mismos formatos. Destacan su capacidad para responder a entradas de audio en tan solo 232 milisegundos, similar al tiempo de respuesta humano en una conversación, y su mejora en visión y comprensión de audio en comparación con modelos anteriores. Esta innovación promete transformar la experiencia del usuario en ChatGPT, el chatbot de OpenAI, al introducir capacidades de video además de voz y texto. A través de una serie de videos, la compañía muestra cómo GPT-4o puede identificar entornos, traducir en tiempo real, resolver problemas matemáticos, e incluso expresar emociones a través de la entonación, entre otras habilidades.

Además de mejorar las capacidades del modelo, OpenAI ha priorizado la experiencia de interacción para que sea más sencilla y natural, permitiendo a los usuarios enfocarse en colaborar con la herramienta. El CEO de la compañía, Sam Altman, ha generado expectación con un enigmático tuit que algunos interpretan como una referencia a la película «Her», sugiriendo una posible evolución hacia la interacción humana con asistentes digitales.

La compañía asegura que GPT-4o es seguro, sometiéndolo a diversas técnicas de filtrado de datos y refinamiento del comportamiento del modelo, así como a evaluaciones humanas y automatizadas durante todo el proceso de capacitación. Actualmente, las capacidades de texto e imagen de GPT-4o están disponibles para usuarios de ChatGPT en modalidad gratuita o Plus con límite ampliado de mensajes, mientras que las modalidades de audio y vídeo estarán disponibles en las próximas semanas. Lo mismo se aplica para desarrolladores que ya pueden acceder a las capacidades de texto e imagen de GPT-4o en la API, con acceso a audio y video próximamente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

ÚLTIMOS POSTS

ÚLTIMOS POSTS

PUEDE INTERESARTE

¿CONECTAMOS?

POSTS MÁS COMENTADOS

Scroll al inicio
Email:*
Nombre:*
Apellidos:*
Empresa:*
Cargo:
Sector:
Teléfono:
Dirección postal:

Rellenar si se quiere recibir la revista física.
Acepto recibir la newsletter y comunicaciones de Ecommerce News conforme a la Política de Privacidad:
Acepto recibir comunicaciones comerciales de terceros:
Resumen de privacidad

Las cookies y otras tecnologías similares son una parte esencial de cómo funciona nuestra web. El objetivo principal de las cookies es que tu experiencia de navegación sea más cómoda y eficiente y poder mejorar nuestros servicios y la propia web. Aquí podrás obtener toda la información sobre las cookies que utilizamos y podrás activar y/o desactivar las mismas de acuerdo con tus preferencias, salvo aquellas Cookies que son estrictamente necesarias para el funcionamiento de la web de eCommerce News. Ten en cuenta que el bloqueo de algunas cookies puede afectar tu experiencia en la web y el funcionamiento de la misma. Al pulsar “Guardar cambios”, se guardará la selección de cookies que has realizado. Si no has seleccionado ninguna opción, pulsar este botón equivaldrá a rechazar todas las cookies. Para más información puedes visitar nuestra Políticas de Cookies. Podrás cambiar en cualquier momento tus preferencias de cookies pinchando en el enlace “Preferencias de cookies” situado en la parte inferior de nuestra web.