OpenAI ha anunciado la integración de una nueva función en ChatGPT que permite la generación de imágenes realistas directamente desde el chat, eliminando la necesidad de recurrir a herramientas externas como DALL-E. Esta característica se basa en el modelo GPT-4o, que utiliza un enfoque autorregresivo y su conocimiento del mundo real para ofrecer resultados de nivel profesional de manera más intuitiva y útil. ​

Capacidades avanzadas de generación de imágenes

La generación de imágenes en ChatGPT aprovecha tanto las entradas de texto como las imágenes dentro del contexto de la conversación, asegurando coherencia en los resultados. Esto es especialmente útil para tareas como el diseño de personajes, donde la apariencia se mantiene consistente a medida que se perfecciona. Además, GPT-4o puede manejar descripciones complejas que incluyen hasta 10 o 20 objetos diferentes, superando las limitaciones de otros sistemas que suelen tener dificultades con entre 5 y 8 objetos. ​

Aplicaciones clave de la nueva función

La incorporación de la generación de imágenes en ChatGPT abre un abanico de posibilidades en diversos ámbitos:​

-Materiales profesionales: Creación de diagramas, infografías y gráficos promocionales personalizados para redes sociales, incluyendo logotipos e instrucciones complejas.​

-Contenido educativo: Elaboración de carteles instructivos, visualización de conceptos de aprendizaje y tarjetas de presentación con alto contenido textual.​

-Personalización de imágenes: Generación de fotos de stock adaptadas con fondos transparentes para presentaciones y diapositivas.​

-Fotorrealismo avanzado: Producción de imágenes fotográficas de alta calidad con precisión en iluminación, sombras y texturas.​

-Edición basada en imágenes existentes: Personalización de pinturas de mascotas, edición de retratos e inspiración para decoración de interiores basada en fotografías reales.​

-Generación contextual: Creación de imágenes que reflejan temas discutidos previamente en la conversación, como carteles de aves específicas de una región o representaciones de períodos históricos del arte. ​

predicciones chatgpt catalunya (1)
predicciones chatgpt catalunya (1)

Ejemplo práctico de uso

Para ilustrar la capacidad de esta función, considere el siguiente ejemplo proporcionado por OpenAI:​

"Crea una imagen fotorrealista de dos brujas de veintitantos años (una con balayage ceniza y la otra con cabello castaño rojizo largo y ondulado) leyendo una señal de tráfico. Contexto: una calle cualquiera de Williamsburg, Nueva York, con un poste cubierto por numerosas señales detalladas (por ejemplo, horarios de barrido, permisos de estacionamiento, clasificación de vehículos y normas de remolque), incluyendo algunas señales ridículas en el centro: (parafraseando para que estas señales sean legítimas) 'Estacionamiento de escobas para brujas no permitido en la Zona C', 'Carga y descarga de alfombras mágicas solo (límite de 15 minutos)' y 'Estacionamiento de renos solo con permiso (24-25 de diciembre)'. Los infractores serán incluidos en la lista de los traviesos. La señal está a la derecha de una calle. No se deben repetir las señales. Las señales deben ser realistas. Personajes: una bruja sostiene una escoba y la otra tiene una alfombra mágica enrollada. Están en primer plano, de espaldas a la cámara y con la cabeza ligeramente inclinada mientras examinan los carteles." ​

Este ejemplo demuestra el nivel de detalle y precisión que GPT-4o puede alcanzar al interpretar descripciones textuales complejas para generar imágenes coherentes y realistas.​

La nueva función de generación de imágenes en ChatGPT representa un avance significativo en la integración de capacidades visuales dentro de plataformas de inteligencia artificial conversacional. Al permitir a los usuarios crear imágenes realistas a partir de descripciones textuales, se amplían las posibilidades creativas y se facilita la producción de contenido visual de alta calidad en diversos contextos profesionales y educativos.

openAI chatGPT EFE
openAI chatGPT EFE