Imagen : Le générateur d’images de Google, désormais accessible à tous via Gemini

Collage de six chiens dans différents environnements forestiers, certains réalistes et d’autres plus stylisés. On y voit des chiens de tailles variées, dont un grand berger allemand et un petit terrier, dans des scènes de nature qui alternent entre réalisme photographique et styles artistiques plus créatifs, comme des champignons géants dans une forêt aux couleurs vives. Les images semblent générées par Imagen via Gemini, démontrant la capacité du modèle à produire des rendus photoréalistes et stylisés dans des styles artistiques divers. Un chien dans la forêt. Image Imagen Google Gemini. Gennn, l'actualité des intelligences artificielles génératives.

Google a ouvert au grand public Imagen, son générateur d’images via Gemini, après l’I/O 2024. Plus photoréaliste et intégré à SynthID pour lutter contre les deepfakes, il reste toutefois limité face à Midjourney.



Le 9 octobre, Google a ouvert à tous son générateur d’images, Imagen, via la plateforme Gemini, offrant une nouvelle expérience de création visuelle. Accessible aussi simplement que DALL-E l’est dans ChatGPT, Imagen permet désormais à n’importe quel utilisateur de générer des images en quelques secondes, directement depuis l’interface de Gemini.

Dévoilée en mai lors de la conférence I/O 2024, cette fonctionnalité était initialement réservée à un nombre restreint d’utilisateurs. Aujourd’hui, elle devient disponible à un public beaucoup plus large. Pour générer une image, il suffit de décrire ce que l’on souhaite dans Gemini, et le modèle s’occupe du reste, rendant la création visuelle simple et rapide, même pour les novices.

Des améliorations dans cette nouvelle version

La nouvelle version d’Imagen présente plusieurs améliorations notables par rapport à ses versions précédentes. Tout d’abord, la qualité globale des images a été considérablement renforcée, avec un rendu plus photoréaliste, atteignant un niveau de réalisme comparable à des outils comme Midjourney ou Flux, qui sont parmi les plus performants du marché.

En outre, Imagen offre désormais une plus grande diversité de styles artistiques, permettant aux utilisateurs de personnaliser davantage leurs créations selon leurs envies. Mais l’innovation majeure réside dans l’intégration de la technologie SynthID, un système conçu pour marquer de manière invisible les images générées. Cette fonctionnalité vise à lutter contre la désinformation et à prévenir la diffusion de deepfakes, en permettant d’identifier facilement les contenus créés artificiellement. Grâce à cette avancée, Google renforce la sécurité et la transparence autour des images produites avec Imagen.

Des limites notables

Malgré ses avancées, Imagen présente encore plusieurs limitations. Par exemple, la génération de personnes photoréalistes n’est accessible qu’aux détenteurs de comptes Gemini Advanced, Business, ou Enterprise. De plus, même pour ces utilisateurs, le modèle ne permet pas la création d’individus clairement identifiables, la représentation de mineurs, ou la génération de scènes sanglantes, violentes, ou sexuelles, afin de respecter des standards éthiques stricts.

Certaines fonctionnalités restent réservées aux abonnés premium, ce qui limite l’expérience pour les utilisateurs standard. Par ailleurs, Imagen ne génère pour le moment que des images carrées, et l’option d’inpainting — la retouche d’images générées — n’est pas encore disponible, bien qu’elle soit prévue pour une future mise à jour. Un lien hypertexte renvoie vers un lexique expliquant ce terme technique pour les utilisateurs non familiers.

Le test

Lors de mon test d’Imagen, j’ai noté une certaine rapidité d’exécution. En à peine une dizaine de secondes, l’image est générée, ce qui est plutôt satisfaisant. Quant à la qualité des images, elle est intéressante, bien que le photoréalisme ne rivalise pas encore avec celui offert par des outils comme Midjourney.

La reproduction de personnes n’est pas encore possible dans la version standard, mais Google annonce que cette fonctionnalité sera bientôt disponible pour les utilisateurs de Gemini Advanced. Une autre limitation à noter : Imagen ne permet de générer qu’une image à la fois, ce qui peut freiner la productivité dans certains projets.

En termes de création avec styles artistiques, les résultats sont variables. Les images vectorielles sont réussies, mais des styles plus spécifiques comme l’encre de Chine ne sont pas supportés, tandis que le style psychédélique donne des résultats intéressants. En revanche, l’insertion de lien comme référence de style ne fonctionne pas.

Concernant le respect des prompts, Imagen a tendance à simplifier les descriptions. Par exemple, une scène détaillée décrivant un chien dans une forêt dense ou un Yorkshire dans un supermarché est simplifiée, réduisant ainsi la richesse du visuel.

Verdict

Mon verdict sur Imagen est plutôt mitigé. Intéressant, oui, mais surtout si l’on n’a pas d’autres alternatives à portée de main. L’outil est accessible et facile à utiliser, ce qui en fait une bonne option pour des utilisateurs occasionnels ou peu exigeants. Cependant, Imagen n’est clairement pas conçu pour les professionnels de la création visuelle, qui, sans surprise, continueront de préférer des outils plus avancés comme Midjourney.

En effet, les fonctionnalités restent encore très limitées. Pour ceux qui recherchent un contrôle poussé sur leurs créations, Imagen ne répond pas aux attentes. Voici les principales limitations :

  • Pas de gestion des formats : impossible de choisir la taille ou les dimensions de l’image, on reste limité à des formats carrés.
  • Pas d’inpainting ni d’outpainting pour l’instant, deux outils essentiels pour retoucher ou étendre une image.
  • Pas de création ni de persistance de personnages, un inconvénient majeur pour ceux qui veulent créer des personnages récurrents ou uniques.
  • Enfin, il n’y a pas de possibilité de reprendre un style à partir d’un lien, ce qui limite la personnalisation et l’adaptation à des œuvres ou styles préexistants.

En somme, Imagen est un bon outil pour de la création rapide et simple, mais il manque de profondeur pour les créateurs avancés qui auront besoin de plus de contrôle et de fonctionnalités.

Par Brice Matter

____________________________

Pour ne rien rater de l’actualité des IA génératives, abonnez-vous ici à la Newsletter Gennn !