Amazon presenta su nueva familia de modelos fundamentales Nova

ciudad de pasta
AWS

El director ejecutivo de Amazon, Andy Jassy, ​​subió al escenario en la conferencia re:Invent de la compañía el martes para mostrar seis nuevos modelos de generación de texto, imágenes y videos a los que llama Amazon Nova.

Esta nueva familia de IA generativas multimodales incluye Nova Micro, un modelo de solo texto creado para respuestas de bajo costo y baja latencia; Nova Lite, un modelo multimodal de bajo costo para procesar imágenes, videos y entradas de texto; y Nova Pro, su modelo multimodal de propósito general que combina "precisión, velocidad y costo para una amplia gama de tareas", según la publicación del anuncio de la compañía . Nova Premier es el “modelo multimodal más capaz de Amazon para tareas de razonamiento complejas”, mientras que Nova Canvas es un motor dedicado de conversión de texto a imagen y Nova Reel está diseñado específicamente para generar video.

Los modelos basados ​​en texto se han optimizado en 15 idiomas diferentes. Micro ofrece una ventana de contexto de 128.000 tokens, mientras que Lite y Pro pueden manejar hasta 300.000 tokens (alrededor de 225.000 palabras o 30 minutos de vídeo). La compañía planea ampliar las ventanas contextuales de sus modelos más grandes hasta 2 millones de tokens a principios del próximo año. 

Canvas permite a los usuarios generar y editar imágenes utilizando indicaciones en lenguaje natural. Los carretes, que competirán con Gen-3 Alpha , Kling y Dall-E 3 , pueden generar clips de hasta seis segundos de duración a partir de mensajes de texto e imágenes de referencia. El generador de vídeo también ofrece control de movimiento de la cámara, incluidos desplazamientos y zooms.

“Hemos seguido trabajando en nuestros propios modelos de frontera”, dijo Jassy a la multitud reunida, “y esos modelos de frontera han logrado un enorme progreso en los últimos cuatro o cinco meses. Y pensamos que si encontrábamos valor en ellos, probablemente tú también encontrarías valor en ellos”.

Jassy también dice que estos modelos se encuentran entre los menos costosos de operar y los más rápidos de su clase, aunque la compañía aún no ha publicado datos de referencia que respalden esas afirmaciones. "Hemos optimizado estos modelos para que funcionen con sistemas propietarios y API, de modo que pueda realizar múltiples pasos automáticos orquestados (comportamiento del agente) mucho más fácilmente con estos modelos", dijo. "Así que creo que son muy convincentes".

Los modelos Micro, Lite y Pro (así como Canvas y Reels) están actualmente disponibles para los clientes de AWS. El estreno llegará en el primer trimestre de 2025.