Hacer clic y arrastrar la edición de imágenes con IA podría cambiarlo todo

El último desarrollo en inteligencia artificial es una herramienta que le permite editar una imagen ya generada según sus especificaciones.

Digamos que desea "cambiar las dimensiones de un automóvil o transformar una sonrisa en un ceño fruncido con un simple clic y arrastrar", podría hacerlo con este modelo llamado DragGAN.

Arrastre su GAN: manipulación interactiva basada en puntos en la variedad de imágenes generativas

página de papel: https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA

– AK (@_akhaliq) 19 de mayo de 2023

La Red adversa generativa (GAN) se encuentra actualmente en la forma de un trabajo de investigación, sin embargo, ha atraído tanta atención de aquellos interesados ​​en ver sus demostraciones que la página de inicio del equipo de investigación se ha bloqueado debido al intenso tráfico.

The Verge comparó DragGAN con la herramienta Warp en Photoshop, y agregó que es mucho más poderosa ya que no "aplasta los píxeles", sino que "regenera el objeto subyacente" e incluso puede rotar imágenes en 3D.

El potencial de una herramienta de este tipo radica en el hecho de que la IA generativa de texto a imagen no siempre genera lo que podría desear. Por lo tanto, puede volver después y realizar ediciones en una imagen existente, en lugar de tener que generar automáticamente una nueva imagen.

Algunas demostraciones que forman parte del trabajo de investigación incluyen agregar altura a una montaña, cambiar la posición de una modelo y editar el largo y la forma de su ropa, abrir o cerrar la boca de un león y cambiar la cara de una persona de una apariencia simple a una sonrisa. Con muchas herramientas de IA disponibles actualmente, los usuarios tienen que regenerar una imagen con un aviso más específico para obtener un resultado más deseable.

El equipo de investigación señaló en su artículo que se pueden agregar nuevos detalles dentro de la regeneración de los aspectos editados de las imágenes que son beneficiosos para la actualización. “Nuestro enfoque puede alucinar contenido ocluido, como los dientes dentro de la boca de un león, y puede deformarse siguiendo la rigidez del objeto, como la flexión de una pata de caballo”.

Hay muchas marcas que intentan ofrecer opciones de edición para contenido generativo de IA. Sin embargo, la mayoría no llega tan lejos como para permitir la edición real de imágenes, sino más bien aspectos como la edición alrededor de las imágenes. Por ejemplo, la aplicación Designer de Microsoft le permite generar imágenes de IA a partir de un mensaje de texto, y puede seleccionar su favorito de tres resultados, luego llevarlo al estudio de diseño donde puede crear una gran cantidad de proyectos basados ​​en la creatividad y la productividad, como publicaciones en redes sociales, invitaciones, postales digitales o gráficos con la imagen como punto focal. Sin embargo, no puede editar la imagen generada por IA.

Dado que la herramienta DragGAN sigue siendo una demostración por ahora, no se sabe cuál sería la calidad de una tecnología fácilmente disponible, o si sería posible, especialmente porque las demostraciones se basan en videos de baja resolución. Sin embargo, es un ejemplo interesante de lo rápido que continúa desarrollándose la IA.