OpenAI vient de lancer officiellement Dall-E 3, la prochaine génération de la célèbre plateforme d'IA générative Dall-E, en mettant l'accent sur des capacités de création d'images basées sur du texte considérablement améliorées, qui peuvent gérer « beaucoup plus de nuances et de détails » que le Dall-E. E2.
"Les systèmes modernes de conversion texte-image ont tendance à ignorer les mots individuels ou les descriptions triviales, obligeant les utilisateurs à apprendre la technique à la volée", a déclaré OpenAI. Cependant, Dall-E 3 représente un bond en avant dans la capacité de créer des images qui adhèrent précisément au texte que vous fournissez.
En d’autres termes, Dall-E 3 est mieux à même de comprendre le contexte, sans sauter de mots spécifiques comme la version précédente. Cela inclut la création de rendus même des plus petits détails des invites de texte et le placement d'un espacement approprié entre eux et d'autres éléments de la scène, comme la lune au-dessus de la rue dans l'image ci-dessous. En particulier, Dall-E 3 promet de pouvoir créer avec plus de précision des mains humaines, une tâche avec laquelle de nombreux générateurs d'images IA existants ont toujours eu du mal.

OpenAI indique que l'algorithme d'IA de DALL-E 3 a été amélioré pour mieux comprendre la signification du texte saisi, au lieu de se concentrer uniquement sur des mots-clés spécifiques comme les versions précédentes. Cela permet à DALL-E 3 de considérer et d'évaluer l'ensemble du contexte d'entrée pour créer une image plus appropriée.
Dall-E 3 sera disponible pour les clients ChatGPT Plus et Enterprise à partir d'octobre via une interface de programmation d'application (API). Les utilisateurs peuvent faire des demandes d'images et ajuster des rappels via le chat avec ChatGPT. En combinant les compétences linguistiques d'un chatbot avec un générateur d'images, l'idée d'OpenAI vise à aider les utilisateurs à créer des images précises et hautement personnalisables. Même avec des commandes simples, ChatGPT peut être étendu en commandes longues et détaillées pour instruire DALL-E 3.
Lorsqu'une idée est suggérée, ChatGPT créera automatiquement des invites détaillées et appropriées pour que Dall-E 3 transforme votre idée en réalité. Si vous aimez une image en particulier mais qu'elle ne convient pas très bien, vous pouvez demander à ChatGPT de la modifier en quelques mots seulement.
Dans l’ensemble, le lancement de Dall-E 3 a marqué une avancée importante pour la technologie d’IA de création d’images, promettant d’ouvrir de nombreuses nouvelles opportunités pour les applications de création de contenu à l’avenir.

Cependant, dans son annonce de Dall-E 3, OpenAI a reconnu les inquiétudes croissantes concernant le risque de fraude utilisant les images générées par l'IA. "Nous recherchons également les meilleurs moyens d'aider les gens à identifier quand les images ont été créées à l'aide de l'IA", a déclaré OpenAI. La société travaille sur un outil interne pour déchiffrer l’art généré par l’IA par rapport à l’art généré par l’homme, et annonce qu’elle en partagera davantage bientôt. Espérons qu'OpenAI relancera bientôt son outil de détection de texte généré par l'IA. Cet outil a été désactivé en juillet en raison de mauvaises performances.