Google vient de lever le voile sur « Gemini 2.5 Flash Image », un modèle d’IA aussi connu sous le sobriquet de « nano-banana ». Ce modèle vient enrichir la génération d’images sur Gemini en permettant aux utilisateurs de retoucher une image avec une simple requête.
En clair, l’IA peut retoucher une image fournie par l’utilisateur, sans devoir générer une nouvelle image de A à Z. Il suffit de charger une ou plusieurs photos puis de décrire dans une requête ce que l’on souhaite modifier. L’IA applique les changements automatiquement tout en respectant l’image d’origine et ses caractéristiques. Gemini 2.5 Flash Image permet d’effectuer « des transformations ciblées » sur une photo, se félicite le géant de Mountain View.
À lire aussi : On a testé Veo 3, le super générateur de vidéos de Google
De quoi « Gemini 2.5 Flash Image » est-il capable ?
Comme l’explique Google, ce « modèle de génération et d’édition d’images de pointe » s’intègre à Gemini et permet aussi de « mélanger plusieurs images en une seule image ». Plus besoin de retoucher manuellement une image pour les retouches et les éditions les plus basiques. Vous pouvez par exemple virer un élément, ajouter quelque chose, déplacer un objet, changer la couleur d’un meuble, revoir l’arrière-plan ou encore mettre de la couleur sur une image en noir et blanc.
Notez qu’il est possible de faire plusieurs retouches à la suite sur une même photo avec Gemini. L’IA ne va pas tout changer à chaque nouvelle version de votre création. Pas besoin de repartir à zéro à chaque modification, comme c’est le cas avec la plupart des IA de génération d’images, dont ChatGPT. Celui-ci a en effet la facheuse tendance à modifier tout le contenu d’une image, et d’altérer les visages par exemple, au moindre changement.
Google précise d’ailleurs que le système est conçu pour ne pas modifier le visage d’une personne d’une version de la photo à l’autre. L’IA est programmée de manière que « les photos de vos amis, de votre famille et même de vos animaux de compagnie ressemblent constamment à eux-mêmes ». C’est un véritable atout pour Gemini par rapport aux autres services d’IA sur le marché. La plupart des outils peinent encore à proposer une retouche d’images convaincante. Trop souvent, l’image ne ressemble plus à rien après quelques modifications, même minimes.
À lire aussi : on a testé les 5 choses sur ChatGPT qui ont changé cet été
De la retouche d’images pour tout le monde
Développé par Deepmind, la filiale de Google consacrée à l’intelligence artificielle, le modèle est apparu sur Internet quelques jours avant l’annonce. Sous l’appellation de « nano-banana », il a suscité l’enthousiasme des internautes.
Désormais, Flash Image est disponible pour tous les utilisateurs de Gemini, même ceux qui n’ont pas souscrit à un abonnement. Les utilisateurs gratuits peuvent réaliser jusqu’à 100 modifications d’images par jour. De leur côté, les abonnés aux offres Google, comme Google AI Pro, peuvent réaliser 10 fois plus de retouches que les autres.
On a testé « Gemini 2.5 Flash Image »
Intrigués par la promesse de Google, on a réalisé quelques tests avec « Gemini 2.5 Flash Image ». On a notamment combiné plusieurs images en demandant à Gemini de réaliser une composition logique et esthétique. Si l’IA parvient bien à fusionner des images, même des contenus qui n’ont rien à voir entre eux, elle pèche parfois par son sens de l’esthétique. En fait, Gemini fait des montages à la manière d’un apprenti graphiste sur Photoshop. Sans une requête bien calibrée, et un peu de soin dans la manière dont vous parlez avec l’IA, vous n’obtiendrez pas de montages bien finis du premier coup. Sans grande surprise, le modèle n’a pas un sens inné de la composition.

Par contre, Gemini 2.5 Flash excelle dans la conservation de l’intégrité des images. Même si vous réalisez des dizaines de retouches, et de modifications conséquentes, les photos de vos proches resteront intactes. C’est, à nos yeux, la plus grande nouveauté apportée par le modèle d’IA. Il est désormais possible d’affiner progressivement une image sans se retrouver avec des contenus à des années-lumière de la photo originale. Dans certains cas, Gemini a néanmoins tendance à altérer les couleurs après quelques requêtes. Du reste, l’IA fait des merveilles dans les retouches discrètes, comme l’ajout d’un élément, ou la modification de la couleur.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.
Source : Google