Cómo puedes probar el nuevo modelo de vista previa o1 de OpenAI por ti mismo
A pesar de meses de rumores de desarrollo, el lanzamiento de OpenAI de su Proyecto Strawberry la semana pasada fue una sorpresa , y muchos analistas creían que el modelo no estaría listo hasta al menos durante semanas, si no más tarde en el otoño.
El nuevo modelo o1-preview y su contraparte o1-mini ya están disponibles para su uso y evaluación; aquí le explicamos cómo obtener acceso usted mismo.
Estamos lanzando una vista previa de OpenAI o1, una nueva serie de modelos de IA diseñados para dedicar más tiempo a pensar antes de responder.
Estos modelos pueden razonar a través de tareas complejas y resolver problemas más difíciles que los modelos anteriores en ciencia, codificación y matemáticas. https://t.co/peKzzKX1bu
– OpenAI (@OpenAI) 12 de septiembre de 2024
¿Qué es o1?
OpenAI no ha ocultado sus aspiraciones de inteligencia artificial general (AGI), y el Proyecto Strawberry (ahora conocido como “o1”) es el siguiente paso de la compañía hacia ese objetivo. Es el primero de una nueva línea de modelos de "razonamiento", "diseñados para dedicar más tiempo a pensar antes de responder", según una publicación de anuncio de OpenAI . Esa estrategia permite que el modelo "razone a través de tareas complejas y resuelva problemas más difíciles que los modelos anteriores en ciencia, codificación y matemáticas".
Según se informa, los modelos razonan de manera humana, lo que les permite "refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores", a medida que adquieren experiencia a través del entrenamiento. Según OpenAI, o1-preview funciona a la par con Ph.D. estudiantes de física, química y biología, y se desempeña de manera similar en pruebas de referencia en esas materias. o1 también es experto en codificación y problemas matemáticos , con una puntuación del 83 % en un examen de calificación de la Olimpiada Internacional de Matemáticas (IMO), donde GPT-4o solo obtuvo una puntuación del 13 % y alcanzó el percentil 89 en una competencia de Codeforces contra oponentes humanos.
aquí está o1, una serie de nuestros modelos más capaces y alineados hasta el momento: https://t.co/yzZGNN8HvD
o1 todavía tiene fallas, sigue siendo limitado y todavía parece más impresionante en el primer uso que después de pasar más tiempo con él. pic.twitter.com/Qs1HoSDOz1
– Sam Altman (@sama) 12 de septiembre de 2024
o1-mini es una versión ligera del modelo estándar o1-preview. Según se informa, su funcionamiento es un 80% menos costoso que la iteración más grande, lo que lo hace especialmente capaz en tareas de generación y análisis de codificación.
¿Está disponible o1-preview para probar?
Sí, los modelos de vista previa de o1 se lanzaron el 12 de septiembre para los suscriptores de ChatGPT Plus y Teams. Los usuarios empresariales y educativos tendrán acceso a principios de la semana siguiente.
¿Qué tan seguro es o1 contra malos actores?
Mucho, al parecer. Según se informa, OpenAI desarrolló un programa de capacitación en seguridad completamente nuevo que aprovecha las mayores capacidades de razonamiento del modelo para que cumpla de manera más eficiente con sus pautas de seguridad y alineación. La compañía señala que en las pruebas, donde GPT-4o obtuvo una puntuación de 22 (sobre 100) en resistencia a los intentos de jailbreak, el nuevo modelo o1 obtuvo una puntuación de 84.
¿Cómo obtengo acceso a o1-preview?
Al igual que con todas las nuevas funciones de IA generativa, la vista previa de o1 recientemente lanzada actualmente solo está disponible para suscriptores de pago. Si desea probarlo usted mismo, deberá obtener una suscripción Plus de $ 20 al mes. Simplemente haga clic en el botón de opción Plan de actualización en la parte inferior del panel de navegación izquierdo y siga las instrucciones en pantalla para ingresar sus detalles de pago.
Una vez activada su suscripción, seleccione o1-preview u o1-mini en el selector de modelo en el lado izquierdo de la página de inicio de ChatGPT. Tenga en cuenta que el acceso es limitado, incluso para los usuarios que pagan, con un límite de tarifa semanal de 30 mensajes para o1-preview y 50 mensajes para o1-mini. OpenAI dice que eventualmente pondrá o1-mini a disposición de los usuarios de la capa gratuita, aunque la compañía aún no ha fijado una fecha para ese lanzamiento.