Google Whisk : la nouvelle révolution du générateur d’images IA sans prompt textuel

Google vient de présenter Whisk, un nouvel outil d’intelligence artificielle capable de créer des images à partir d’autres images, plutôt que de s’appuyer uniquement sur des descriptions textuelles détaillées.

Comment fonctionne Whisk ?

Contrairement aux générateurs d’images classiques, qui produisent des visuels à partir de textes, Whisk vous permet de définir le sujet, la scène et le style de l’image en fournissant des exemples visuels. Vous pouvez même combiner plusieurs images pour affiner chaque aspect. Si vous n’avez pas d’images sous la main, Whisk peut vous en proposer, générées par l’IA. Il est aussi possible d’ajouter quelques mots-clés ou précisions textuelles pour mieux guider le résultat.

Le processus de génération

Une fois que vous avez fourni vos images de référence, Whisk génère plusieurs propositions, chacune accompagnée d’un prompt textuel correspondant. Vous pouvez alors sélectionner celles qui vous plaisent, les télécharger, ou encore les ajuster en modifiant le prompt ou en ajoutant des indications supplémentaires. Google précise que Whisk se prête davantage à une exploration visuelle rapide qu’à une retouche pixel par pixel. Les résultats ne seront donc pas toujours parfaits du premier coup, mais vous aurez la possibilité de peaufiner vos images pour vous rapprocher de ce que vous recherchez.

La technologie derrière Whisk

Whisk s’appuie sur la dernière version du modèle de génération d’images de Google, Imagen 3. Ce modèle offre une qualité et un réalisme nettement améliorés, permettant d’obtenir des visuels plus convaincants et proches de la réalité.

Disponibilité

Pour le moment, Whisk est disponible en version preview uniquement aux États-Unis. Google n’a pas encore communiqué de date pour un déploiement dans d’autres pays.

En conclusion

Avec Whisk, Google propose une nouvelle approche de la création d’images par IA, basée sur la « recomposition » d’éléments visuels existants plutôt que sur des descriptions textuelles. Cette méthode offre une plus grande souplesse dans la génération de contenus visuels, tout en laissant à l’utilisateur la possibilité de peaufiner le résultat final.

Lexique

Générateur d’images par IA : Outil utilisant l’intelligence artificielle pour produire des visuels à partir de descriptions textuelles ou d’autres images.
Prompt : Indication ou description fournie à un modèle d’IA pour guider la génération d’images ou de réponses.
Imagen 3 : Version la plus récente du modèle de génération d’images de Google, offrant un rendu plus réaliste.

En savoir plus

https://blog.google/technology/google-labs/whisk/