El interés y la cobertura mediática que está suscitando la llegada de DeepSeek-R1 en las últimas horas ha hecho que algunas empresas e investigadores revisen la seguridad de esta inteligencia artificial china y, más, después de que la compañía tras la misma reconociera haber sufrido una brecha de datos sin dar muchos más detalles.
Investigadores de la firma de servicios en la nube Wiz han hallado una base de datos de ClickHouse de acceso público perteneciente a DeepSeek.
Esta base expondría más de 1 millón de líneas de flujos de registros, conteniendo historial de chat, claves secretas, detalles del backend y otra información altamente confidencial.
"A medida que DeepSeek generaba revuelo en el espacio de la IA, nos propusimos evaluar su postura de seguridad externa e identificar posibles vulnerabilidades. En cuestión de minutos, encontramos una base de datos de ClickHouse de acceso público vinculada a DeepSeek, completamente abierta y sin autenticar, que exponía datos confidenciales. Estaba alojada en oauth2callback.deepseek.com:9000 y dev.deepseek.com:9000", cuenta el equipo de Wiz Research.
"Esta base de datos contenía un volumen significativo de historial de chat, datos de back-end e información confidencial, incluidos flujos de registros, secretos de API y detalles operativos", añaden.
Lo más preocupante es que la exposición suponía el control total de la base de datos y una posible escalada de privilegios dentro del entorno de DeepSeek, sin ningún mecanismo de autenticación o defensa hacia el mundo exterior.
Desde Wiz advierten de que el nivel de acceso planeaba un "riesgo crítico para la propia seguridad de DeepSeek y para sus usuarios finales". A través de esta vulnerabilidad un actor de amenazas podría hacerse con registros confidenciales y mensajes de chat en texto sin formato, además de extraer contraseñas en texto sin formato y archivos locales.
ClickHouse es un sistema de gestión de bases de datos en columnas de código abierto diseñado para realizar consultas analíticas rápidas en grandes conjuntos de datos. Fue desarrollado por la rusa Yandex y es usada ampliamente para el procesamiento de datos en tiempo real, el almacenamiento de registros y el análisis de big data, lo que indica que "dicha exposición es un descubrimiento muy valioso y sensible".
Divulgación responsable
El equipo de Wiz Research reveló el problema de forma inmediata y responsable a la empresa china, la cual rápidamente habría asegurado la exposición.
No obstante, los investigadores recuerdan que "la rápida adopción de servicios de IA sin la seguridad correspondiente es inherentemente arriesgada. Esta exposición pone de relieve el hecho de que los riesgos de seguridad inmediatos para las aplicaciones de IA surgen de la infraestructura y las herramientas que las respaldan".
En un comunicado enviado a los medios la firma de seguridad Kaspersky recordaban que en el caso de DeepSeek su carácter de código abierto resulta ser un arma de doble filo, ya que si bien los marcos de software de código abierto fomentan la transparencia, la colaboración y la innovación, también conllevan riesgos de seguridad y dilemas éticos. La compañía de origen ruso comentaba que la explotación de software de código abierto fue una tendencia importante en el panorama de amenazas del año pasado.
Desde Kaspersky también insistían en que los ciberdelincuentes buscan explotar este tipo de herramientas con fines maliciosos y ya han observado tendencias similares con otros modelos de IA populares, que se han utilizado para actividades como la creación de correos electrónicos de phishing. Estas herramientas también pueden emplearse como señuelo para difundir estafas y aplicaciones maliciosas.