Más de un millón de líneas del historial de chat de DeepSeek quedaron expuestas en tan solo unos minutos

Investigadores de ciberseguridad de Wiz han encontrado una base de datos de ClickHouse propiedad de la empresa china de inteligencia artificial DeepSeek que contiene más de un millón de líneas de historial de chat e información confidencial. La base de datos era de acceso público y permitió a los investigadores un control total sobre las operaciones de la base de datos.

La exposición se aseguró rápidamente después de que Wiz compartiera su descubrimiento con DeepSeek, pero es posible que la información ya haya sido expuesta. Las investigaciones de este tipo no husmean demasiado en las bases de datos que encuentran por razones éticas, pero Wiz concluyó que un atacante podría potencialmente escalar sus privilegios dentro del entorno DeepSeek y recuperar registros confidenciales, mensajes de chat, contraseñas y archivos locales, todo sin necesitando algún tipo de autenticación.

Captura de pantalla de la investigación de Wiz sobre la seguridad de DeepSeek.
mago / mago

Wiz apuntó a la startup debido a los recientes rumores en los medios sobre su modelo de razonamiento R1 , con el objetivo de evaluar su seguridad externa. De manera algo sorprendente, la base de datos de ClickHouse apareció después de solo unos minutos de búsquedas básicas y Wiz pudo interactuar con ella a través de la interfaz HTTP de ClickHouses.

A partir de ahí, todo lo que los investigadores tuvieron que hacer fue ejecutar MOSTRAR TABLAS; consulta y apareció una lista de conjuntos de datos accesibles, incluida la tabla "log_steam" que incluía muchas líneas de información confidencial.

En su informe, Wiz advierte sobre la velocidad de la adopción de la IA y cómo esta presión para desarrollar, lanzar e integrar productos de IA lo más rápido posible puede conducir a prácticas de seguridad peligrosas. Con todos los datos importantes y confidenciales que manejan ahora los programas de IA, la industria necesita aplicar prácticas de seguridad sólidas que coincidan con las de los proveedores de nube pública y los principales proveedores de infraestructura.