OpenAI ne compte pas se laisser distancer par Google dans le domaine de la génération d’images. L’entreprise a annoncé le lancement de ChatGPT Images 2.0, un modèle plus polyvalent, gérant mieux le texte et pouvant aller chercher des informations sur le net. Une longue page d’exemples est disponible sur le site d’OpenAI.

Sans surprise, cette version améliore l’expérience et devrait apporter de meilleurs résultats grâce à un modèle suivant mieux les consignes. S’il est accessible à tous, les abonnés aux formules Plus, Pro, Business ou Enterprise pourront faire appel à des capacités de réflexion. Celles-ci permettent aux modèles de faire des recherches sur le Web pour obtenir des informations en temps réel, mais aussi de créer plusieurs images distinctes à partir d'une seule consigne et de vérifier ses propres résultats.

Cette révision laisse désormais la possibilité de choisir parmi différents formats d’images (16:9, 4:3), ce qui sera pratique pour ceux voulant publier sur les réseaux sociaux ou pour certains projets. Il est également plus à l’aise avec certaines langues n’utilisant pas l’alphabet latin, comme le mandarin ou le coréen. Dans sa documentation destinée aux développeurs, l’entreprise explique que ce modèle vise surtout à réduire le nombre d’essais nécessaires pour obtenir un résultat exploitable, avec une qualité élevée par défaut.

Mis à part cela, OpenAI vante de meilleurs résultats pour les images photoréalistes ainsi que pour celles contenant beaucoup de texte (BD, poster, fiches de personnages…). Bien que les avancées soient intéressantes, l’entreprise explique que le modèle a toujours du mal avec des détails devant apparaître correctement sur des surfaces cachées, inclinées ou inversées. De même, les légendes des diagrammes et des schémas peuvent poser problème. La nouveauté peut être essayée dès maintenant dans ChatGPT, sur l’app comme via le web.











