Gemini, la IA de Google para competir con ChatGPT ya está aquí

El gigante tecnológico Google reta a OpenAI con su nuevo modelo de lenguaje natural, Gemini, que ya puede utilizarse en su chatbot Bard. Gemini es el modelo de LLM (large language model) de la compañía más flexible hasta el momento y está optimizada para tres tamaños diferentes: ultra, pro y nano, que se diferencia por el peso del modelo y el tipo de tareas que pueden realizar.

Google ha decidido lanzar Gemini en Bard en dos fases. Primero Bard se actualizará con la versión de Gemini Pro adaptada para ofrecer los mejores resultados a los usuarios y verá la luz primero en inglés en 170 países para luego pasar a incluir otros idiomas y más países. Después, incorporará la versión Gemini Ultra, ofreciendo así el mejor modelo de IA.

«Ya estamos comenzando a experimentar con Gemini en la Búsqueda, donde está haciendo que nuestra Experiencia Generativa de Búsqueda (SGE) sea más rápida para los usuarios, con una reducción del 40% en la latencia en inglés en los EE. UU., junto con mejoras en la calidad.», comparten en el comunicado.

Gemini Pro se arma contra ChatGPT

Google ha tardado más en lanzar Gemini, ya que han estado trabajando intensamente realizando diversas pruebas y evaluaciones para comprobar su desempeño en una amplia variedad de tareas. Algunas de las pruebas que han realizado son comprensión de imágenes naturales y audios, así como razonamiento matemático. El equipo de Google ha podido observar que el desempeño de Gemini supera en varias tareas al desempeño que realiza GPT 3.5 en las mismas.

Además, ha obtenido una puntuación del 90,0% en MMLU (massive multitask language understanding), superando a los expertos humanos. Nuestro nuevo enfoque de referencia para MMLU permite a Gemini utilizar sus capacidades de razonamiento para pensar más detenidamente antes de responder preguntas difíciles, lo que genera mejoras significativas con respecto al simple uso de su primera impresión.

Fuente: Blog de Google

«Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como empresa. Estoy realmente emocionado por lo que está por venir y por las oportunidades que Gemini desbloqueará para personas de todo el mundo«, compartió Sundar Pichai, director ejecutivo de Google y Alphabet.

Las diferentes versiones de Gemini responden a:

  • Gemini Ultra : nuestro modelo más grande y capaz para tareas altamente complejas.
  • Gemini Pro : nuestro mejor modelo para escalar en una amplia gama de tareas.
  • Gemini Nano : nuestro modelo más eficiente para tareas en el dispositivo.

En el comunicado también han hablado de Bard Advanced, que será la versión que incluya Gemini Ultra que puede comprender y actuar sobre diferentes tipos de información, como puede ser el texto, imágenes, audio, video y código, ya que tiene capacidades de razonamiento multimodal. Esta actualización será la más potente.

Capacidades de Geminis

Diseñamos Gemini para que sea multimodal de forma nativa, previamente entrenado desde el principio en diferentes modalidades: 

  • Razonamiento multimodal, lo que le permite comprender datos visuales y escritos complejos. Esta capacidad facilita la extracción de conocimientos valiosos de grandes cantidades de información, ofreciendo avances digitales rápidos en áreas como la ciencia y las finanzas al procesar cientos de miles de documentos de manera eficiente.
  • Reconocer y comprender texto, imágenes, audio y más al mismo tiempo, por lo que comprende mejor la información matizada y puede responder preguntas relacionadas con temas complicados. Esto lo hace especialmente bueno para explicar el razonamiento en materias complejas como matemáticas y física.
  • Múltiples lenguajes de programación, como Python, Java, C++ y Go, y destaca como un modelo líder en codificación. Gemini Ultra sobresale en importantes evaluaciones de rendimiento, como HumanEval y Natural2Code. Además, sirve como base para sistemas de codificación avanzados, como AlphaCode y su versión evolucionada, AlphaCode 2, capaces de resolver desafíos más allá de la codificación, como problemas matemáticos y de informática teórica.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

ÚLTIMOS POSTS

ÚLTIMOS POSTS

PUEDE INTERESARTE

¿CONECTAMOS?

POSTS MÁS COMENTADOS

Scroll al inicio
Email:*
Nombre:*
Apellidos:*
Empresa:*
Cargo:
Sector:
Teléfono:
Dirección postal:

Rellenar si se quiere recibir la revista física.
Acepto recibir la newsletter y comunicaciones de Ecommerce News conforme a la Política de Privacidad:
Acepto recibir comunicaciones comerciales de terceros: