Amazon presenta su nueva familia de modelos fundamentales Nova

diciembre 5, 2024 Aranzulla de Los Pobres

El director ejecutivo de Amazon, Andy Jassy, subió al escenario en la conferencia re:Invent de la compañía el martes para mostrar seis nuevos modelos de generación de texto, imágenes y videos a los que llama Amazon Nova.

Esta nueva familia de IA generativas multimodales incluye Nova Micro, un modelo de solo texto creado para respuestas de bajo costo y baja latencia; Nova Lite, un modelo multimodal de bajo costo para procesar imágenes, videos y entradas de texto; y Nova Pro, su modelo multimodal de propósito general que combina "precisión, velocidad y costo para una amplia gama de tareas", según la publicación del anuncio de la compañía . Nova Premier es el “modelo multimodal más capaz de Amazon para tareas de razonamiento complejas”, mientras que Nova Canvas es un motor dedicado de conversión de texto a imagen y Nova Reel está diseñado específicamente para generar video.

Los modelos basados en texto se han optimizado en 15 idiomas diferentes. Micro ofrece una ventana de contexto de 128.000 tokens, mientras que Lite y Pro pueden manejar hasta 300.000 tokens (alrededor de 225.000 palabras o 30 minutos de vídeo). La compañía planea ampliar las ventanas contextuales de sus modelos más grandes hasta 2 millones de tokens a principios del próximo año.

Canvas permite a los usuarios generar y editar imágenes utilizando indicaciones en lenguaje natural. Los carretes, que competirán con Gen-3 Alpha , Kling y Dall-E 3 , pueden generar clips de hasta seis segundos de duración a partir de mensajes de texto e imágenes de referencia. El generador de vídeo también ofrece control de movimiento de la cámara, incluidos desplazamientos y zooms.

“Hemos seguido trabajando en nuestros propios modelos de frontera”, dijo Jassy a la multitud reunida, “y esos modelos de frontera han logrado un enorme progreso en los últimos cuatro o cinco meses. Y pensamos que si encontrábamos valor en ellos, probablemente tú también encontrarías valor en ellos”.

Jassy también dice que estos modelos se encuentran entre los menos costosos de operar y los más rápidos de su clase, aunque la compañía aún no ha publicado datos de referencia que respalden esas afirmaciones. "Hemos optimizado estos modelos para que funcionen con sistemas propietarios y API, de modo que pueda realizar múltiples pasos automáticos orquestados (comportamiento del agente) mucho más fácilmente con estos modelos", dijo. "Así que creo que son muy convincentes".

Los modelos Micro, Lite y Pro (así como Canvas y Reels) están actualmente disponibles para los clientes de AWS. El estreno llegará en el primer trimestre de 2025.