OpenAI acaba de lanzar oficialmente Dall-E 3, la próxima generación de la famosa plataforma de IA generativa Dall-E, centrándose en capacidades de creación de imágenes basadas en texto muy mejoradas, que puede manejar "significativamente más matices y detalles" que Dall-E 3. mi 2.
"Los sistemas modernos de conversión de texto a imagen tienden a ignorar palabras individuales o descripciones triviales, lo que obliga a los usuarios a aprender la técnica sobre la marcha", dijo OpenAI. Sin embargo, Dall-E 3 representa un salto cualitativo en la capacidad de crear imágenes que se adhieran con precisión al texto que proporcionas”.
En otras palabras, Dall-E 3 es más capaz de comprender el contexto, sin omitir palabras específicas como la versión anterior. Esto incluye crear representaciones de hasta los detalles más pequeños de las indicaciones de texto y colocar el espacio adecuado entre ellos y otros elementos de la escena, como la luna sobre la calle en la imagen de abajo. En particular, Dall-E 3 promete poder crear manos humanas con mayor precisión, una tarea con la que muchos generadores de imágenes de IA existentes siempre han tenido problemas.

OpenAI dice que el algoritmo de IA en DALL-E 3 se ha mejorado para comprender mejor el significado del texto de entrada, en lugar de centrarse únicamente en palabras clave específicas como en versiones anteriores. Esto permite a DALL-E 3 considerar y evaluar todo el contexto de entrada para crear una imagen más apropiada.
Dall-E 3 estará disponible para los clientes de ChatGPT Plus y Enterprise a partir de octubre a través de una interfaz de programación de aplicaciones (API). Los usuarios pueden realizar solicitudes de imágenes y ajustar recordatorios a través del chat con ChatGPT. Al combinar las habilidades lingüísticas de un chatbot con un generador de imágenes, la idea de OpenAI tiene como objetivo ayudar a los usuarios a crear imágenes precisas y altamente personalizables. Incluso con comandos simples, ChatGPT se puede expandir a comandos largos y detallados para instruir a DALL-E 3.
Cuando se sugiere una idea, ChatGPT creará automáticamente indicaciones detalladas y apropiadas para que Dall-E 3 convierta su idea en realidad. Si te gusta una imagen en particular pero no es muy adecuada, puedes pedirle a ChatGPT que la edite con solo unas pocas palabras.
En general, el lanzamiento de Dall-E 3 marcó un importante paso adelante para la tecnología de IA de creación de imágenes, y promete abrir muchas nuevas oportunidades para aplicaciones de creación de contenido en el futuro.

Sin embargo, en su anuncio de Dall-E 3, OpenAI reconoció las crecientes preocupaciones sobre el riesgo de fraude al abusar de las imágenes generadas por IA. "También estamos investigando las mejores formas de ayudar a las personas a identificar cuándo se crearon imágenes utilizando IA", dijo OpenAI. La compañía está trabajando en una herramienta interna para descifrar el arte generado por IA versus el arte generado por humanos, y dice que compartirá más pronto. Con suerte, OpenAI pronto revivirá su herramienta de detección de texto generada por IA. Esta herramienta fue desactivada en julio debido a su bajo rendimiento.