Google renforce l'application Gemini avec le modèle d'IA Nano Banana pour un traitement avancé des photos

Pour savoir tout ce qu'il se passe sur la toile
Répondre
Avatar du membre
chtimi054
Administrateur du site
Administrateur du site
Messages : 9992
Enregistré le : ven. 26 juil. 2013 06:56
A remercié : 152 fois
A été remercié : 796 fois
    Windows 10 Firefox

Google renforce l'application Gemini avec le modèle d'IA Nano Banana pour un traitement avancé des photos

Message par chtimi054 »

Google renforce l'application Gemini avec le modèle d'IA Nano Banana pour un traitement avancé des photos
Une sortie qui va tuer les autres outils d'édition d'images comme Photoshop, d'après les connaisseurs

Google a renforcé l'application Gemini grâce à une mise à jour majeure qui améliore ses capacités d'édition d'images. Le nouveau modèle d'intelligence artificielle (IA) Nano Banana est conçu pour pallier les lacunes précédentes et proposer des outils d'édition plus avancés aux utilisateurs. Selon les connaisseurs, cette mise à jour pourrait même « tuer » les autres outils d'édition d'images, comme Photoshop.

Cette mise à jour intervient peu après que Google a présenté une préversion améliorée 06-05 de Gemini 2.5 Pro, s'appuyant sur la version I/O Edition du mois de mai 2025. Selon l'entreprise, cette version 06-05 apporte des progrès significatifs en matière de codage, de raisonnement et de benchmarks scientifiques, avec des gains notables dans les scores Elo sur LMArena et WebDevArena.

L'intégration de Nano Banana dans Gemini témoigne par ailleurs de l'investissement continu de Google dans l'IA pratique, qui vise à rendre les tâches d'édition complexes accessibles à un public plus large. Elle intervient à un moment où les produits d'IA destinés aux consommateurs gagnent rapidement du terrain dans les domaines créatifs et professionnels.
Des options d'édition plus intelligentes dans Gemini

Google a lancé la fonctionnalité native de modification d'images dans l'application Gemini plus tôt cette année et s'est efforcé de l'améliorer, en mettant particulièrement l'accent sur le maintien de la ressemblance d'un personnage d'une image à l'autre. Nano Banana apporte des améliorations notables en termes de précision et de détails. Les anciens outils d'édition de Gemini manquaient souvent de finesse, mais le dernier modèle affine les transformations des photos avec des résultats plus nets.

« Nous savons que lorsque vous modifiez des photos de vous-même ou de personnes que vous connaissez bien, les imperfections subtiles ont leur importance : une représentation « proche mais pas tout à fait identique » ne semble pas correcte. C'est pourquoi notre dernière mise à jour est conçue pour que les photos de vos amis, de votre famille et même de vos animaux de compagnie restent fidèles à eux-mêmes, que vous essayiez une coiffure en choucroute des années 60 ou que vous mettiez un tutu à votre chihuahua », indique Google.

Pour modifier une image, il suffit de fournir une photo à Gemini et de lui indiquer les modifications que l'on souhaite apporter pour ajouter une touche personnelle. Une fois l'édition terminée, il est possible de télécharger l'image modifiée dans Gemini pour la transformer en une vidéo amusante.

Les utilisateurs peuvent également télécharger des images personnelles et appliquer des modifications contextuelles grâce à une requête « Reimagine », créant ainsi des versions entièrement nouvelles de la même photo.
Image Par exemple, un simple portrait peut être adapté à plusieurs scénarios, comme placer le sujet dans une aire de jeux ou générer une version astronaute en combinaison spatiale. Le système est conçu pour suivre de près les instructions descriptives, fournissant des résultats qui allient créativité et précision technique.

En plus de réimaginer des photos individuelles, la mise à jour introduit des capacités d'édition multiple. Cette fonctionnalité permet aux utilisateurs de combiner deux images distinctes en une seule composition homogène. Par exemple, une personne et un animal domestique photographiés séparément peuvent être recréés ensemble dans une scène commune. L'accent est mis sur le réalisme et des transitions plus fluides, ce qui était auparavant difficile à réaliser.

Exemples de scénarios

Voici quelques suggestions à essayer pour explorer cette nouvelle fonctionnalité d'édition d'images :

Changement de costume ou de décor : L'intégration permet de télécharger une photo d'une personne ou d'un animal domestique, et le modèle conservera son apparence dans chaque image lorsque l'utilisateur le placera dans de nouveaux scénarios. « Essayez de vous mettre dans différentes tenues ou professions, ou même de voir à quoi vous ressembleriez dans une autre décennie, tout en conservant votre apparence », indique Google.
Image Fusion des photos : Les utilisateurs peuvent désormais télécharger plusieurs photos et les fusionner pour créer une toute nouvelle scène. Par exemple, il possible de prendre une photo d'une personne et une autre de son chien pour créer un portrait parfait des deux sur un terrain de basket.
Image Modification en plusieurs étapes : La fonctionnalité permet aux utilisateurs de continuer à modifier les images créées par Gemini. Il est par exemple possible de prendre une pièce vide, de peindre les murs, puis d'ajouter une bibliothèque, des meubles ou une table basse. Gemini aidera alors à modifier certaines parties d'une image tout en préservant le reste.

Mélange de designs : application du style d'une image à un objet dans une autre. Les utilisateurs peuvent prendre la couleur et la texture des pétales d'une fleur et les appliquer à une paire de bottes de pluie, ou créer une robe en utilisant le motif des ailes d'un papillon.

Les utilisateurs payants et gratuits du monde entier peuvent dès aujourd'hui essayer cette fonctionnalité de retouche d'image mise à jour dans l'application Gemini. Toutes les images créées ou modifiées dans l'application Gemini comportent un filigrane visible, ainsi que le filigrane numérique invisible SynthID de Google, afin d'indiquer clairement qu'elles ont été générées par l'IA.

Si les progrès techniques de Gemini annoncent une nouvelle ère dans le domaine de la retouche d'images, son empreinte environnementale soulève encore des questions. Google a récemment indiqué que le traîtement d'un prompt par son IA Gemini consomme l'équivalent de 9 secondes de télévision et 5 gouttes d'eau. Les experts contestent toutefois ces chiffres, alléguant que Google les manipulerait pour faire croire que l'IA consomme moins d'énergie.

merci à Developpez.com
Répondre