Google nos trae dos de las novedades que anunciaron en su conferencia Google I/O. La primera de ellas es sobre los Gems, una herramienta que permite personalizar Gemini para convertirlo en una IA experta en cualquier tema que desee el usuario. Estará disponible para los usuarios de Gemini Advanced, Business y Enterprise en determinados idiomas y países.
La segunda novedad es Imagen 3, nuestro nuevo modelo de generación de imágenes, que se puede usar para la creación de imágenes generales en Gemini (versión gratuita) y está disponible en español. Además, la generación de imágenes de personas está disponible en Gemini Advanced, Business y Enterprise, en inglés.
Ayuda personalizada con Gems
Los Gems se pueden personalizar para convertirte en un experto en cualquier tema, y se pueden refinar en línea con los objetivos específicos del usuario. Lo único que hay que hacer es escribir una serie de instrucciones y asignarle un nombre. A partir de ahí, puedes chatear con tu Gem en cualquier momento.
En el comunicado, Google explica que «Con los Gems es como si pudieras crear un equipo de expertos que te pueden ayudar a dar forma a un proyecto complejo, aportar ideas para un evento que estás preparando o escribir el pie de foto perfecto para una publicación en tus redes sociales. Cada Gem también es capaz recordar instrucciones detalladas, con el fin de ahorrar tiempo al usuario en tareas aburridas, repetitivas o difíciles».
Para facilitar el proceso, han lanzado una serie de Gems adaptados a distintas temáticas:
- Tutor personal: ayuda a desbrozar información compleja, de modo que resulte más fácil de entender.
- Exploración de ideas: inspiración al alcance de tu mano; desde ideas originales para una fiesta temática hasta el regalo ideal para un cumpleaños.
- Orientación profesional: analiza tu potencial de desarrollo profesional y te propone planes detallados para mejorar tus competencias y avanzar en tu carrera.
- Revisión de escritura: te ayuda a mejorar el nivel de redacción a través de comentarios claros y constructivos, que cubren todos los aspectos de la escritura, desde la gramática hasta la estructura.
- Asistente de programación: es un complemento perfecto para escribir código de programación; ayuda a sacar adelante proyectos y a aprender sobre la marcha.
Genera imágenes de alta calidad con Imagen 3
Imagen 3 abre una nueva dimensión en cuanto a calidad de imagen, y es capaz de generar imágenes a partir de instrucciones breves. Permite pedirle a Gemini que cree imágenes en distintos estilos; por ejemplo, paisajes fotorrealistas, imágenes con textura de pintura al óleo o caprichosas animaciones con plastilina.
La capacidad avanzada de generación de imágenes de Imagen 3 se acompaña de un sistemas de protección y respeta los principios de diseño de productos de Google. Imagen 3 ha obtenido resultados superiores a los de otros modelos de generación de imágenes en una gran variedad de pruebas comparativas. Y utiliza SynthID, la herramienta de inserción de marcas de agua en las imágenes generadas.
El principios de diseño de Google se centra en: «el usuario mantiene el control del proceso creativo de principio a fin. Si la imagen inicial no cumple tus expectativas, solo tienes que decirle a Gemini qué te gustaría cambiar y obtendrás una nueva imagen».