El equipo de Stable Diffusion acaba de lanzar un rival de ChatGPT de código abierto

abril 20, 2023 Aranzulla de Los Pobres

El desafío más nuevo para ChatGPT de OpenAI proviene de la compañía que fabrica el popular generador de imágenes de IA Stable Diffusion . Conocido como StableLM, Stability AI desarrolló este chatbot de código abierto para democratizar el acceso a modelos de lenguaje avanzados.

Stability AI anunció recientemente la versión alfa de StableLM y señaló que es una solución más pequeña y eficiente que la mayoría de las demás. StableLM utiliza solo entre tres mil millones y siete mil millones de parámetros, entre un 2 % y un 4 % del tamaño del modelo de 175 mil millones de parámetros de ChatGPT.

Estabilidad IA

Así como Stable Diffusion es un generador de imágenes más accesible que puede ser ampliado por desarrolladores externos, StableLM ofrece la misma solución gratuita y de código abierto que un chatbot de IA que está disponible para todos.

Gracias a la capacitación en un nuevo conjunto de datos experimentales de EleutherAI llamado "The Pile", StableLM puede mantener conversaciones y escribir código con alto rendimiento. Stability AI señala que este conjunto de datos contiene 1,5 billones de tokens, tres veces más grande que el conjunto de datos utilizado para entrenar la mayoría de los modelos de IA. ChatGPT se capacitó en "The Pile", pero se sometió a más refinamientos después, incluido el aprendizaje por refuerzo para ayudar a reducir los resultados defectuosos. ChatGPT ha avanzado considerablemente desde que se lanzó al público, y la mayoría siente que es el líder del chat de IA.

Un modelo de IA altamente eficiente es fundamental para Stability AI, ya que quiere que StableLM funcione en sistemas de menor costo y GPU menos potentes. Puede instalar y ejecutar la versión alfa de StableLM hoy. Las instrucciones están en el repositorio de GitHub , junto con un cuaderno con detalles sobre cómo usarlo en una computadora con capacidades de GPU limitadas.

La forma más fácil de probar StableLM es ir a la página de demostración de Hugging Face. Dado que se acaba de lanzar y es probable que haya una gran demanda, los tiempos de respuesta pueden ser lentos y, como versión alfa, los resultados no serán tan buenos como los de la versión final.

Por ejemplo, cuando le pedí a StableLM que me ayudara a escribir una carta de disculpa por romper el teléfono de alguien, me dijo que hice lo que se suponía que debía hacer. La IA de alguna manera lo entendió mal y pensó que le di un regalo en lugar de dañar un teléfono.

La versión alfa de StableLM se confunde a veces,

Stability AI incluye un descargo de responsabilidad sobre los resultados, ya que StableLM es un modelo de lenguaje grande preentrenado sin ajustes adicionales. No utiliza el aprendizaje por refuerzo, como lo hace ChatGPT, por lo que las respuestas "pueden ser de calidad variable y pueden incluir potencialmente lenguaje y puntos de vista ofensivos".

No se sabe si los modelos StableLM actualizados que están por venir pueden competir con ChatGPT. Por el momento, es claramente un trabajo en progreso. Lo mismo sucedió con otro retador de código abierto llamado CollosalGPT .

Este no es el final de la historia, sin embargo. Stability AI dijo que modelos más grandes con 15 mil millones, 30 mil millones y 65 mil millones de parámetros están en progreso y deberían ayudar a refinar los resultados. Se planea un modelo de 175 mil millones de parámetros para el futuro. Dado el tamaño de modelo limitado disponible actualmente, StableLM ha tenido un buen comienzo.

La naturaleza de código abierto y la implementación liviana de la versión alfa de StableLM cumplen el propósito de permitir que los desarrolladores comiencen a trabajar en aplicaciones. Hay suficiente potencial de crecimiento y mejora por lo que vale la pena estar atento a este nuevo chatbot de IA.