«Eres ChatGPT»: un mensaje filtrado del sistema revela el funcionamiento interno de GPT-5.
¿Qué ha pasado? Un supuesto mensaje del sistema GPT-5 se filtró a través de Reddit y GitHub este fin de semana. El mensaje revela las reglas exactas establecidas en ChatGPT para interactuar con los usuarios y realizar diversas tareas.
- Un usuario de Reddit afirma haber descubierto “la información textual del sistema y las herramientas” para GPT-5 , el último modelo de lenguaje grande (LLM) de OpenAI.
- El texto completo del mensaje también apareció en GitHub un día antes.
- El mensaje comienza con las palabras: “Eres ChatGPT, un gran modelo de lenguaje basado en el modelo GPT-5 y entrenado por OpenAI”.
- Luego continúa especificando el límite de conocimiento para GPT-5, que se dice que será 2024-06.
- La personalidad aparece como “v2”, lo que implica correctamente que ChatGPT ha pasado por algunos cambios de personalidad a lo largo del tiempo.
- Los comandos brindan mucha información sobre el tipo de respuestas que ChatGPT ahora puede ofrecer y muestran cómo la empresa intenta darle forma.
- Un cambio notable ordena a GPT-5 no decir lo siguiente: "¿Le gustaría que lo haga?; quiere que haga eso; quiere que lo haga; si quiere, puedo; avíseme si desea que lo haga; debería; debo".
- Aunque ambas fuentes afirman que el mensaje del sistema es 100% real, los usuarios de Hacker News cuestionan su autenticidad y reproducibilidad, señalando que son posibles los mensajes señuelo/canario.
Esto es importante porque: si es real, el texto ofrece una visión poco común de cómo se maneja ChatGPT; si es falso, muestra lo fácil que es sembrar “filtraciones” que parecen plausibles.
- El sistema indica el tono, el comportamiento seguro y el uso de herramientas.
- Las filtraciones pueden informar los intentos de jailbreak, pero sobre todo nos dan una idea del funcionamiento interno de los LLM.
- Estos cambios podrían contribuir significativamente a facilitar el uso de GPT-5. También se mencionan herramientas de automatización, como la creación de tareas diarias.
- Sin embargo, los materiales de lanzamiento de OpenAI enfatizan la pila de razonamiento/enrutador de GPT-5, no un solo script estático, lo que socava la idea de un mensaje canónico.
¿Por qué debería importarme? Conocer el contenido exacto del mensaje del sistema proporciona al usuario una visión clara del tipo de datos que utiliza GPT-5 y cómo responde a ellos.
- El rumoreado mensaje del sistema muestra algunos cambios realizados por OpenAI que afectan la forma en que GPT-5 se comunica.
- Esto incluye: “Si el siguiente paso es obvio, hazlo” y “Haz como máximo una pregunta aclaratoria necesaria al principio, no al final”.
- También existen extensas pautas sobre cómo generar imágenes, incluidas imágenes de usted mismo.
- La autenticidad no está probada; la esencia puede ser parcial, obsoleta o haber sido introducida intencionalmente.
Bien, ¿qué sigue? La documentación y los archivos del sistema de OpenAI se seguirán actualizando.
- Incluso si este aviso del sistema es real, es posible que cambie con cada versión del modelo y tal vez con cada pequeña actualización enviada al LLM.
- OpenAI no ha publicado ni confirmado ningún aviso del sistema; los materiales oficiales de GPT-5 describen un sistema enrutado, no un script estático.