Gemini 2.0 Flash Image Generation : la nouvelle IA de retouche photo de Google

Google vient de sortir il y a quelques jours une nouvelle IA image révolutionnaire : Gemini 2.0 Flash Image Generation. Accessible via le Google AI Studio, cette fonctionnalité expérimentale permet des modifications d’images directement par prompt, un peu comme on le ferait avec du texte. C’est vraiment bluffant, une vraie dinguerie !

J’ai vu passer des exemples assez fous sur Twitter et notamment un TikTok très sympa de @unefille.ia qui montrait toutes les possibilités. Alors, j’ai voulu tester ça en direct avec toi dans ma dernière vidéo.

Attention, comme c’est encore expérimental, tout ne fonctionne pas parfaitement, mais ça donne un aperçu incroyable de ce qui nous attend. Pas de fake dans ma démo, on voit les réussites comme les ratés !

Au sommaire :

Ma vidéo de test en direct

Comment accéder et utiliser Gemini 2.0 Flash Image Generation ?

Pour tester cette pépite :

Rends-toi sur aistudio.google.com (il faut un compte Google).
Dans l’interface (qui ressemble un peu aux Playgrounds d’OpenAI ou Anthropic), clique sur « Create prompt ».
Sur la droite, dans la section « Model », sélectionne le modèle qui fait le buzz : « Gemini 2.0 Flash (Image Generation) Experimental ». Il est marqué « HOT ».
Tu peux alors uploader une image (ou plusieurs) via le petit « + » en bas ou par glisser-déposer.
Écris ton prompt en anglais (c’est mieux pour les IA image) pour décrire les modifications souhaitées.
Clique sur « Run » et admire (ou pas !) le résultat.

Les capacités (et les limites) de cette IA

Ce qui fonctionne bien

Dans mes tests, j’ai été assez impressionné par certaines capacités :

Créer une photo stylée : En partant d’une photo simple, j’ai demandé une version plus « classe » pour LinkedIn, avec une belle veste de costume, style photographe pro. Le résultat était très correct et ressemblant.

Changer un objet dans la main : J’ai pu remplacer un téléphone que je tenais par une liasse de billets de 100 dollars. L’intégration était quasi parfaite, plus besoin de Photoshop pour ça !

Changer de vue : Transformer une photo de face en photo de profil a bien fonctionné (après un petit ajustement du prompt).
Modifier le style d’une miniature : Rendre une miniature YouTube plus « putaclic » (clickbait) en demandant des couleurs vibrantes, une composition dynamique et une expression de surprise (bouche et yeux grands ouverts). Le résultat était… efficace !
Nettoyer une image : Enlever du texte, des logos ou des watermarks (attention aux droits d’auteur !) fonctionne remarquablement bien. L’IA reconstruit l’arrière-plan de manière cohérente.

Là où ça coince encore

Comme l’outil est expérimental, il y a pas mal de ratés, surtout quand on enchaîne les modifications ou qu’on demande des choses complexes :

Modifications multiples : Appliquer plusieurs prompts successivement sur la même image générée peut dégrader fortement le résultat (ex: mettre un costume puis enlever la casquette a déformé mon visage). Il vaut mieux repartir de l’image originale.
Cohérence du visage/corps : Mettre un costume-cravate sur une photo de moi en pied a bien marché, mais l’IA a gardé ma casquette ! Me placer à cheval a aussi donné un résultat étrange au niveau du visage.
Outpainting (étendre l’image) : L’extension de l’arrière-plan n’était pas toujours très logique ou bien intégrée.
Gestion des détails fins (doigts) : Corriger des anomalies comme des doigts en trop (problème classique des IA image) n’a pas fonctionné, l’IA a coupé l’image.
Incrustation complexe : Ajouter deux personnes réalistes dans un décor de studio podcast a échoué lamentablement. L’IA n’arrive pas encore à gérer ce niveau de complexité en combinant plusieurs images sources et un décor.

Modification de texte : Changer « Nice » en « Cannes » sur une photo a fonctionné pour le texte mais a déformé le reste de l’image et mon visage. Un second essai en précisant de garder le sujet au premier plan a mieux marché pour le texte, mais l’arrière-plan (« I Love ») était moins bien géré.

Malgré ces défauts de jeunesse, Gemini 2.0 Flash Image Generation est une vraie révolution. La retouche photo assistée par IA progresse à une vitesse folle. C’est une dinguerie à tester absolument si tu t’intéresses à la création visuelle !

Cocréateur pour t’aider à devenir un créateur augmenté par l’IA

Mon Livre « Cocréateur » (Eyrolles) est disponible depuis le 20/02/2025 en librairie (18€) et en ebook (9,99€). Lien du livre.

Couverture du livre Cocréateur par Jean-Baptiste Viet

Tu y trouveras un concentré d’expertise de créateurs augmentés par l’IA pour maîtriser plus de 60 outils d’IA texte, photo, vidéo, son, et transformer tes idées en contenus engageants visibles sur Google, YouTube, Linkedin, TikTok, Instagram,… et même dans un livre !

Et toi, qu’as-tu pensé de Gemini 2.0 Flash Image Generation ? Tu as réussi à faire des trucs sympas ou tu as rencontré les mêmes galères que moi ? Partage ton expérience et tes prompts qui marchent (ou pas !) en commentaire !