Los chatbots van a Washington con ChatGPT Gov

enero 30, 2025 Aranzulla de Los Pobres

gafas y chatgpt — Matheus Bertelli / Pexels

En una publicación de X el lunes comentando el repentino éxito de DeepSeek, el CEO de OpenAI, Sam Altman, prometió "realizar algunos lanzamientos" y parece que lo ha hecho. OpenAI presentó su producto más nuevo el martes, una "versión personalizada de ChatGPT diseñada para proporcionar a las agencias gubernamentales de EE. UU. una forma adicional de acceder a los modelos fronterizos de OpenAI", según la publicación del anuncio . Según se informa, ChatGPT Gov ofrecerá medidas de seguridad de datos aún más estrictas que ChatGPT Enterprise, pero ¿cómo manejará las alucinaciones que afectan a los otros modelos de la compañía?

Según OpenAI, más de 90.000 empleados de los gobiernos federal, estatal y local en 3.500 agencias han consultado ChatGPT más de 18 millones de veces desde principios de 2024. La nueva plataforma permitirá a las agencias gubernamentales ingresar “información confidencial y no pública” en ChatGPT mientras se ejecuta dentro de sus entornos de alojamiento seguros (específicamente, la nube comercial de Microsoft Azure o la nube comunitaria de Azure Government) y marcos de ciberseguridad como IL5 o CJIS. Esto permite a cada agencia "administrar sus propios requisitos de seguridad, privacidad y cumplimiento", dijo a los periodistas Felipe Millon, líder de Ventas Gubernamentales de OpenAI, en la conferencia de prensa del martes.

El r1 de Deepseek es un modelo impresionante, especialmente en lo que respecta a lo que pueden ofrecer por el precio.
¡Obviamente entregaremos modelos mucho mejores y también es realmente estimulante tener un nuevo competidor! sacaremos algunos lanzamientos.
– Sam Altman (@sama) 28 de enero de 2025

La compañía también brindó una demostración de lo que ChatGPT Gov, que se ejecuta sobre el modelo GPT-4o , puede hacer durante la conferencia de prensa. En la demostración, un "empleado federal" inició sesión en ChatGPT, generó un plan de cinco semanas para sus tareas laborales y luego analizó una versión impresa del mismo plan de cinco semanas marcada con notas y apéndices etiquetados a mano. Luego, ChatGPT redactó un memorando para el departamento legal y de cumplimiento de la agencia resumiendo su plan.

"Sé que el presidente Trump también está analizando cómo podemos optimizar eso, porque es una forma de incorporar herramientas de software más modernas al gobierno y ayudar al gobierno a funcionar de manera más eficiente", dijo a CNBC el CPO de OpenAI, Kevin Weil. "Así que estamos muy entusiasmados con eso".

ChatGPT Gov se basa en gran medida en el marco existente de ChatGPT Enterprise , que aún se encuentra en el Programa Federal de Gestión de Autorizaciones y Riesgos y aún no ha sido autorizado para manejar datos no públicos. Aún no hay un cronograma sobre cuándo podría obtenerse esa acreditación, pero es probable que la IA no se implemente entre los empleados reales de la agencia antes de que eso suceda.

Incluso centrándose en la seguridad operativa y de datos, confiar en la IA generativa para tareas tan vitales y sensibles como el funcionamiento del gobierno plantea desafíos únicos y difíciles. Ya hemos visto a más de un abogado atrapado usando chatbots para “ realizar investigaciones ”, lo que los llevó a citar jurisprudencia alucinada , así como a que la policía se base en evidencia defectuosa basada en inteligencia artificial para arrestar a personas injustamente . Los votantes de California también rechazaron recientemente una medida que habría puesto a AI a cargo de la sentencia de libertad bajo fianza.

Es más, un estudio de Stanford HAI de 2024 encontró que los modelos legales populares de Thomas Reuters y LexisNexis, que prometen una “investigación legal libre de alucinaciones”, en realidad alucinaban en sus respuestas, el 34% y el 17% de las veces, respectivamente. Los autores del estudio señalan que esto sigue siendo una mejora significativa con respecto a los chatbots de uso general que alucinaban con respuestas a consultas legales entre el 58% y el 82% de las veces.

El anuncio de OpenAI se produjo apenas unas horas después de que DeepSeek revelara V3 , su último modelo generativo, que ofrece un rendimiento comparable al modelo de razonamiento o1 de última generación de OpenAI mientras utiliza de 20 a 50 veces menos energía, dependiendo de la tarea. La startup china ha desorganizado a la industria estadounidense de la IA con esa revelación, poniendo en duda la necesidad de construir continuamente más y más centros de datos y plantas de energía si un código de IA más eficiente pudiera lograr lo mismo. Nvidia, el principal proveedor mundial de GPU, las unidades de procesamiento especializadas que los sistemas de inteligencia artificial requieren para tareas de entrenamiento e inferencia, perdió 600 mil millones de dólares en capitalización de mercado en respuesta a las noticias de DeepSeek. Las empresas de gas y energía nuclear también vieron caer el valor de sus acciones.