Meta hizo DALL-E para video, y es espeluznante y asombroso

Meta presentó un modelo loco de inteligencia artificial que permite a los usuarios convertir sus descripciones escritas en video. El sistema se llama Make-A-Video y es lo último en una tendencia de contenido generado por IA en la web.

El sistema acepta descripciones breves como "un robot surfeando una ola en el océano" o "un pez payaso nadando en el arrecife de coral" y genera dinámicamente un breve GIF de la descripción. Incluso hay tres estilos diferentes de videos para elegir: surrealista, realista y estilizado.

El pincel de un artista pintando sobre un lienzo de cerca

Según una publicación de Facebook del CEO de Meta, Mark Zuckerberg, traducir texto escrito a video es mucho más difícil debido a que el video requiere movimiento:

“Es mucho más difícil generar videos que fotos porque más allá de generar correctamente cada píxel, el sistema también tiene que predecir cómo cambiarán con el tiempo. Make-A-Video resuelve esto al agregar una capa de aprendizaje no supervisado que permite que el sistema comprenda el movimiento en el mundo físico y lo aplique a la generación tradicional de texto a imagen”.

Una pareja joven caminando bajo una fuerte lluvia

El equipo de investigación de IA de Meta escribió un artículo que describe cómo funciona el sistema y cómo se diferencia de los métodos actuales de texto a imagen (T2I). A diferencia de otros modelos de lenguaje de máquina, el método de texto a video (T2V) de Meta no utiliza pares de texto y video predefinidos. Por ejemplo, no empareja "hombre caminando" con un video de un hombre real caminando.

Si esto se parece mucho a DALL-E, la popular aplicación T2I, no estaría muy lejos. Se han implementado otras aplicaciones T2I desde que DALL-E ganó popularidad. TikTok lanzó un filtro en agosto llamado AI Greenscreen que genera imágenes de estilo de pintura en función de las palabras que escribe.

Un bebé perezoso esponjoso con un sombrero de punto naranja tratando de descifrar una computadora portátil cerca de una pantalla de iluminación de estudio muy detallada que se refleja en su ojo

El contenido generado por IA se ha vuelto bastante popular en los últimos años. La tecnología deepfake , técnicas de aprendizaje automático para reemplazar la cara de una persona con otra, incluso es utilizada por estudios de efectos visuales para programas de gran presupuesto como The Mandalorian .

En julio, The Times informó por error sobre una mujer ucraniana en medio de la guerra entre Rusia y Ucrania. El problema es que ella no era real .

La amenaza de la IA probablemente no sea una amenaza real , pero proyectos como DALL-E y Make-A-Video son exploraciones divertidas de algunas de las posibilidades interesantes.