Los 10 anuncios que hicieron de 2024 un año histórico para la IA
Hemos superado oficialmente el segundo aniversario del inicio del boom de la IA y las cosas no han disminuido. Todo lo contrario. La IA generativa está aumentando a un ritmo que parece casi abrumador, expandiéndose a nuevas plataformas, medios e incluso dispositivos a un ritmo implacable.
Aquí están los 10 anuncios que hicieron de 2024 un año monumental en el mundo de la IA.
OpenAI lanza GPT-4o
Cuando ChatGPT (con GPT-3.5 ) llegó por primera vez en noviembre de 2022, era básicamente un elegante juego de Mad Libs controlado por computadora. No me malinterpreten, incluso esa capacidad fue revolucionaria en ese momento, pero no fue hasta el lanzamiento de GPT-4o en mayo de 2024 que los sistemas de IA generativa realmente cobraron importancia.
Aprovechando la capacidad de su predecesor para analizar y generar texto e imágenes, GPT-4o proporciona una comprensión contextual más completa en comparación con el GPT-4 solo. Esto se traduce en un mejor rendimiento en todo, desde los subtítulos de imágenes y el análisis visual, hasta la generación de contenido creativo y analítico como gráficos, tablas e imágenes.
El modo de voz avanzado ayuda a las computadoras a hablar como humanos
En septiembre, OpenAI demostró una vez más por qué es la empresa líder en inteligencia artificial al lanzar su modo de voz avanzado para los suscriptores de ChatGPT. Esta característica eliminó la necesidad de que los usuarios escriban sus preguntas en una ventana emergente, permitiéndoles conversar con la IA como lo harían con otra persona.
Aprovechando los tiempos de respuesta equivalentes a los humanos de GPT-4o, el modo de voz avanzado cambió fundamentalmente la forma en que las personas pueden interactuar con la inteligencia artificial y ayudó a los usuarios a liberar toda la capacidad creativa de la IA.
La IA generativa llega al límite
Cuando ChatGPT debutó en 2022, era la única IA disponible y estaba disponible precisamente en un lugar: ChatGPT.com. Oh, qué diferencia hacen dos años. Hoy en día, se puede encontrar IA generativa en todo, desde teléfonos inteligentes y dispositivos domésticos inteligentes hasta vehículos autónomos y dispositivos de monitoreo de la salud. ChatGPT, por ejemplo, está disponible como aplicación de escritorio, API, aplicación móvil e incluso a través de un número 800 . Microsoft, por su parte, ha integrado la IA directamente en su línea de portátiles Copilot+ .
Quizás el ejemplo más significativo, por supuesto, sea Apple Intelligence . Puede que no haya sido el lanzamiento más exitoso (muchas de las funciones todavía estamos esperando), pero en términos de hacer que los poderes de la IA generativa sean lo más accesibles posible, nada era tan importante como Apple Intelligence.
Ahora, ni las PC Copilot+ ni Apple Intelligence dieron como resultado lo que probablemente querían las empresas involucradas, especialmente para Microsoft, pero como todos sabemos, esto es solo el comienzo.
El resurgimiento de la producción de energía nuclear
Antes de este año, la energía nuclear se consideraba una propuesta perdedora en Estados Unidos. Considerado poco confiable e inseguro, debido en gran parte al incidente de Three Mile Island de 1979 en el que uno de los reactores primarios de la planta se fundió parcialmente y arrojó material radiactivo y tóxico a la atmósfera. Sin embargo, con las cantidades rápidamente crecientes de energía eléctrica que requieren los grandes modelos lingüísticos modernos (y la enorme presión que ejercen sobre las redes eléctricas regionales), muchas empresas líderes en inteligencia artificial están analizando más de cerca cómo administrar sus centros de datos utilizando la energía del átomo.
Amazon, por ejemplo, compró un centro de datos de inteligencia artificial de propulsión nuclear a Talen en marzo y luego firmó un acuerdo para adquirir pequeños reactores modulares (SMR) miniaturizados y autónomos de Energy Northwest en octubre. Microsoft, para no quedarse atrás, ha comprado la capacidad de producción de Three Mile Island y actualmente está trabajando para que Reactor One vuelva a estar en línea y generar electricidad.
Los agentes están preparados para ser el próximo gran avance en la IA generativa
Resulta que hay una cantidad limitada de datos de entrenamiento, energía y agua que puedes dedicar a la tarea de hacer crecer tu modelo de lenguaje grande hasta que te encuentres con el problema de los rendimientos decrecientes. La industria de la IA experimentó esto de primera mano en 2024 y, en respuesta, ha comenzado a alejarse de los LLM masivos que originalmente definieron la experiencia de IA generativa en favor de los Agentes; Modelos más pequeños y con mayor capacidad de respuesta diseñados para realizar tareas específicas, en lugar de intentar hacer todo lo que un usuario podría pedirle.
Anthropic presentó su agente, denominado Computer Use , en octubre. Microsoft hizo lo mismo con Copilot Actions en noviembre, mientras que, según se informa, OpenAI lanzará su función de agente en enero .
El auge de los modelos de razonamiento
Muchos de los grandes modelos de lenguaje actuales están más orientados a generar respuestas lo más rápido posible, a menudo a expensas de la precisión y la corrección. El modelo de razonamiento o1 de OpenAI, que la compañía lanzó como vista previa en septiembre y como modelo completamente funcional en diciembre, adopta el enfoque opuesto: sacrifica la velocidad de respuesta para verificar internamente el fundamento de una respuesta determinada, asegurando que sea lo más precisa y completa posible. lo más posible.
Si bien esta tecnología aún no ha sido adoptada por completo por el público (o1 actualmente solo está disponible para suscriptores de niveles Plus y Pro), las principales empresas de inteligencia artificial están avanzando con sus propias versiones. Google anunció su respuesta a o1, denominada Gemini 2.0 Flash Thinking Experimental , el 19 de diciembre, mientras que OpenAI reveló que ya está trabajando en el sucesor de o1, al que llama o3 , durante su evento de transmisión en vivo de 12 días de OpenAI el 20 de diciembre.
La búsqueda basada en IA se extiende por Internet
La IA generativa aparentemente está en todas partes hoy en día, entonces, ¿por qué no debería integrarse en una de las funciones más básicas de Internet? Google ha estado jugando con la tecnología durante los últimos dos años, lanzando por primera vez la experiencia generativa de búsqueda en mayo de 2023 antes de implementar su función de descripción general de IA en mayo pasado.AI Overview genera un resumen de la información que un usuario solicita en la parte superior de su página de resultados de búsqueda.
Perplexity AI lleva esa técnica un paso más allá. Su “motor de respuestas” recorre Internet en busca de la información que solicitan los usuarios y luego sintetiza esos datos en una respuesta coherente, conversacional (y citada), eliminando efectivamente la necesidad de hacer clic en una lista de enlaces. OpenAI, siempre innovador, desarrolló un sistema casi idéntico para su chatbot, denominado ChatGPT Search , que debutó en octubre.
Artifact de Anthropic inicia una revolución colaborativa
Intentar generar, analizar y editar archivos de gran tamaño (ya sean ensayos creativos de formato largo o fragmentos de código de computadora) directamente dentro del flujo de chat puede resultar abrumador y requiere desplazarse interminablemente hacia adelante y hacia atrás para ver el documento completo.
La función Artifacts de Anthropic , que debutó en junio, ayuda a mitigar ese problema al proporcionar a los usuarios una ventana de vista previa separada en la que ver el texto elaborado por IA fuera de la conversación principal. La característica resultó ser tal éxito que OpenAI rápidamente hizo lo mismo con su propia versión.
Sus últimos modelos y características han convertido a Anthropic en un oponente formidable para OpenAI y Google este año, lo cual por sí solo parece significativo.
Los generadores de imágenes y vídeos finalmente descubren los dedos
Utilice el control de cámara para dirigir cada toma con intención.
Aprenda cómo hacerlo con la Runway Academy de hoy. pic.twitter.com/vCGMkkhKds
– Pista (@runwayml) 2 de noviembre de 2024
Solía ser que detectar una imagen o un video generado por IA era tan simple como contar el número de apéndices que muestra el sujeto; obviamente se generaba algo más que dos brazos, dos piernas y 10 dedos, como lo demostraron las imágenes estilo Cronenberg de Stable Diffusion 3 en Junio. Sin embargo, a medida que 2024 llega a su fin, diferenciar entre contenido creado por humanos y por máquinas se ha vuelto significativamente más difícil a medida que los generadores de imágenes y videos han mejorado rápidamente tanto la calidad como la precisión fisiológica de sus resultados.
Los sistemas de vídeo de IA como Kling , Gen 3 Alpha y Movie Gen ahora son capaces de generar clips fotorrealistas con una distorsión mínima y un control de cámara de grano fino, mientras que Midjourney , Dall-E 3 e Imagen 3 pueden crear imágenes fijas con un Sorprendente grado de realismo (y mínimos artefactos alucinados) en innumerables estilos artísticos.
Ah, sí, y Sora de OpenAI finalmente hizo su debut como parte de sus anuncios de diciembre . La batalla por los modelos de vídeo generados por IA se está calentando y se volvieron sorprendentemente impresionantes en 2024.
El esfuerzo de 10.000 millones de dólares de Elon Musk para construir el mayor grupo de formación de IA del mundo
xAI lanzó Grok 2.0 este año, el último modelo integrado en X. Pero la noticia más importante sobre la empresa de inteligencia artificial de Elon Musk es hacia dónde se dirige en el futuro. En 2024, Elon Musk se dedicó a construir la “ supercomputadora más grande del mundo ” en las afueras de Memphis, Tennessee, que entró en funcionamiento a las 4:20 am del 22 de julio. Impulsado por 100.000 GPU Nvidia H100, el superclúster tiene la tarea de entrenar nuevas versiones de xAI. Modelo de IA generativa de Grok , que según Musk se convertirá en "la IA más poderosa del mundo".
Se espera que Musk gaste alrededor de 10 mil millones de dólares en costos de capital y de inferencia solo en 2024, pero, según se informa, está trabajando para duplicar la cantidad de GPU que alimentan la supercomputadora en el nuevo año.