
Google ha presentado Imagen flash de Géminis 2.5Su nuevo modelo de generación y edición de Vanguard, que incluye capacidades para combinar varias imágenes en una manteniendo la coherencia de los personajes que aparecen, además de hacer transformaciones específicas con lenguaje natural, durante toda la ‘aplicación’ de Géminis y Google AI Studio.
El gigante tecnológico lanzó su modelo de razonamiento Flash Gemini 2.5 en abril de este año a Vertex AI, diseñada como una opción híbrida al permitir activar o desactivar sus capacidades de razonamiento para encontrar el equilibrio apropiado entre la calidad de sus respuestas, costo y latencia.
Boletín medio comercio
Look: Starship rompe la racha de mala: SpaceX completa completamente su décimo ensayo
Ahora, ante ofrecer una mejor experiencia de edición de imágenes para desarrolladores y usuarios en la ‘aplicación’ de Géminis, con resultados de mayor calidad y «un control creativo más potente», Google ha presentado su nuevo modelo de generación de imágenes flash de Gemini Images 2.5.
Conocido internamente como ‘nanobanana’, este modelo le permite combinar varias imágenes en una, todas manteniendo la coherencia de los caracteres u objetos que se incluyen. Además, también permite transformaciones específicas de imágenes a través del lenguaje natural.
Como la compañía ha detallado en una declaración en su blog para desarrolladores, estas capacidades se han implementado en el «modo de creación» de Google AI Studio como evidencia. Para que los desarrolladores puedan remezclar o dar vida a sus ideas con una sola instrucción en lenguaje natural y, posteriormente, compartirla en Google AI Studio o guardar el código en GitHub.
La edición de imagen nativa en la aplicación de Gemini para todos los usuarios también se ha actualizado, bajo el objetivo de mejorar las capacidades de edición y «mantener la similitud entre las imágenes», ya que «una representación similar pero no la misma no es correcta».
Edición de imagen en Géminis con la nueva imagen flash Gemini Model 2.5.
/Será suficiente compartir con Gemini una foto para editar problemas concretos y «darle un toque único». Por ejemplo, solicitar que la persona que aparece en la foto aparece en nuevos escenarios, pero mantiene su apariencia original en cada imagen. Géminis también puede variar sus atuendos o profesiones, incluso reinventando a la persona en otro momento «sin perder su identidad».
De la misma manera, los usuarios también pueden fusionar fotos, compartir varias imágenes y unificarlas en una para crear una escena completamente nueva. Por lo tanto, puede compartir la imagen de un perro y una persona para que aparezcan de manera cohesiva en la misma imagen.
Además de todo esto, también se pueden solicitar modificaciones concretas de imágenes, como cambiar el color de las paredes de una habitación o agregar muebles, manteniendo el resto de la imagen intacta.
Mira: ¿Qué es un «asado» para la nueva tendencia en Chatgpt?
Google también ha detallado otras novedades que ofrece el modelo es la mezcla de diseños. Es decir, aplique el estilo de una imagen a un objeto de otro. Por ejemplo, use el color y la textura de los pétalos de flores para botas de lluvia.
«Esta actualización hace un trabajo mucho mejor, lo que permite que las ediciones sean más fluidas, y los resultados del modelo pueden usarse para lo que desee», dijo el director de productos en modelos de generación visual en Google Deepmind, Nicole Brichtova, en declaraciones de TechCrunch.
También especificó que todas las imágenes creadas o editadas en la ‘aplicación’ de Gemini incluyen una marca de agua visible, así como la marca de agua digital invisible Synthid.
Sin embargo, Gemini 2.5 Flash Image ahora está disponible a través de la API de Gemini y Google AI Studio para desarrolladores, así como a través de Vertex AI para empresas. Debe tenerse en cuenta que tiene un costo de 30 dólares (25.86 euros por cambio) por millón de tokens de producción, y cada imagen es equivalente a 1,290 tokens de salida. Es decir, la generación de una imagen tiene un costo de $ 0.039 (0.034 euros para cambiar).
Por su parte, la actualización de la edición de imagen nativa en la aplicación de Gemini ahora está disponible para todos los usuarios de forma gratuita.