Se anuncia el nuevo modelo de generación de imágenes de Midjourney para competir con el GPT-4o de OpenAI

Aunque MidJourney se propuso ser uno de los modelos de generación de imágenes más prometedores en los primeros días de la IA, parece haberse quedado atrás de herramientas más accesibles, fáciles de usar y gratuitas como Gemini, ChatGPT y Bing. A sus problemas se suma la última actualización del modelo GPT-4o de OpenAI , que permite una generación de imágenes excepcionalmente buena con la capacidad de recrear fotografías reales y producir texto inmaculado . Entonces, para seguir siendo relevante, o tal vez captar el tren de la exageración desviado por la ola de arte de inteligencia artificial inspirado en Studio Ghibli que inunda Internet, MidJourney está lanzando un modelo actualizado con varias mejoras.

El CEO David Holz anunció los detalles del nuevo modelo V7 en el servidor oficial de Discord de MidJourney y a través de una publicación de blog . Dijeron que el nuevo modelo es "más inteligente con indicaciones de texto" y produce imágenes con una calidad "notablemente superior" y "hermosas texturas".

El modelo también es capaz de generar imágenes en un santiamén, aproximadamente 10 veces más rápido que el modelo actual, afirma Holz, ya que el modo está diseñado para intercambios de ideas e iteraciones frecuentes. Puede cambiar al modo conversacional (solo en la web) y recrear parte de la imagen sin tener que reescribir el mensaje por completo o usar el modo Editar. Las imágenes son de menor calidad y cuestan la mitad de lo que cuestan las imágenes normales.

El modo Conversacional se sustituye por un modo de Voz cuando usas la aplicación Discord en tu computadora o móvil. Holz dice que te permite "pensar en voz alta y dejar que las imágenes fluyan debajo de ti como sueños líquidos". Esta característica también es parte del modo Borrador recientemente introducido.

Además, MidJourney V7 se puede ejecutar en los modos Relax y Turbo para imágenes de alta resolución (que en el modo Borrador), y usar este último le costará el doble de créditos a cambio de una producción de imágenes más rápida.

El nuevo modelo V7 actualmente carece de algunas funciones y los flujos de trabajo volverán de forma predeterminada al V6.1 anterior para las tareas que necesitan ampliación, pintura y retexturización. Finalmente, el modelo también permite la Personalización, donde puede guardar preferencias sobre cómo le gustan sus imágenes y esperar que el modelo produzca los resultados correspondientes. Esto requeriría una configuración de cinco minutos, que lo llevará a través de una serie de 200 imágenes que puede elegir según sus preferencias.

MidJourney actualmente está ejecutando una prueba alfa impulsada por la comunidad para el modelo y promete características adicionales en los próximos 60 días. Puedes probarlo escribiendo /settings en el cuadro de chat de Discord o de la plataforma web, enviar el mensaje y cambiar el modelo predeterminado a V7 desde la configuración que emerge.