OpenAI lanza ChatGPT Images 2.0 centrado en la representación y precisión del texto – MacMagazine

Puntuación0
Puntuación0


Después de obtener una vista previa de una nueva versión con una captura de pantalla de macOS creada por inteligencia artificial, el Abierto AI anunció hoy el Imágenes ChatGPT 2.0su modelo de imágenes de próxima generación. Está diseñado para producir imágenes con mucho texto, incluidas infografías, carteles científicos, guías de estudio y materiales de marketing.

La nueva plantilla mejora naturalmente la tipografía, la iconografía y la composición para producir imágenes más profesionales, además de generar texto en varios idiomas.

Presentamos ChatGPT Imágenes 2.0
Un modelo de imágenes de próxima generación capaz de manejar tareas visuales complejas y producir imágenes precisas y utilizables de inmediato con una edición más nítida, diseños más completos e inteligencia a nivel de análisis.
Vídeo creado con Imágenes ChatGPT

Puede crear hasta ocho imágenes a partir de una sola inmediatocomo un informe de tres páginas, manteniendo la coherencia visual en todas las páginas; un inconveniente es que si desea ajustar una imagen generada por IA, aún necesita regenerarla.

OpenAI afirmó además que está enfocado en mantener su flujo de edición iterativo y basado en instrucciones para que siga siendo fácil de usar.

Hecho con ChatGPT Imágenes 2.0

El nuevo modelo también comprende mejor la representación de texto no latino en idiomas como japonés, coreano, hindi y bengalí.

Más robusto en todos los idiomas

ChatGPT Images 2.0 puede generar imágenes con texto en otros idiomas que no solo se reproducen correctamente, sino que también presentan un lenguaje coherente.

Esto hace que el modelo sea más útil a nivel global y ayuda a las personas a crear imágenes que funcionen en los idiomas que realmente utilizan.

Otros aspectos destacados de ChatGPT Images 2.0 incluyen:

  • Mayor precisión y control: Es capaz de seguir instrucciones, conservar los detalles solicitados y representar los elementos sutiles que a menudo comprometen la calidad de la imagen.
  • Sofisticación estilística y fotorrealismo.: Puede capturar con mayor fidelidad las características llamativas de las fotografías, así como de las imágenes cinematográficas, arte de píxelesmanga y otros lenguajes visuales distintos, con mayor consistencia en textura, iluminación, composición y detalles.
  • Proporciones flexibles: El nuevo modelo admite relaciones de aspecto de hasta 3:1 (ancho) y 1:3 (alto). Puede generar imágenes listas para usar para diferentes formatos, desde pancartas y diapositivas de presentación hasta carteles y gráficos para redes sociales.
  • habilidades de razonamiento: Cuando se selecciona un modelo de razonamiento en ChatGPT, Images 2.0 puede buscar en la web información en tiempo real, crear múltiples imágenes distintas a partir de un único estímulo, verificar sus propios resultados e incluso crear códigos QR que funcionen.
  • Inteligencia del mundo real: El nuevo modelo tiene un umbral de conocimiento actualizado que le permite manejar tareas de un extremo a otro, desde redacción publicitaria hasta análisis y composición de diseños.

Los procedimientos de seguridad de OpenAI no han cambiado significativamente con el nuevo modelo. También incluye metadatos a través del estándar C2PA, lo que permite identificar el origen de las imágenes generadas por IA. Además, las imágenes abusivas e ilegales todavía están prohibidas en las políticas de OpenAI.

Images 2.0 está disponible para todos los usuarios, incluidos los gratuitos, de ChatGPT y Codex. Sin embargo, los suscriptores también pueden crear imágenes usando plantillas. Instante y Pensamientoque le ayudan a buscar información en la web, compilarla en un diseño legible y comprobar su trabajo.

Los desarrolladores que utilizan el modelo en la API pueden crear imágenes en resolución 2K y 4K, aunque estas resoluciones más altas aún están en fase beta y pueden presentar problemas.

Estaremos encantados de escuchar lo que piensas

Deje una respuesta

Lucas Laruffa
Logo