La era de los agentes de IA: cómo afecta a la ciberseguridad
Creo que 2026 será clave en la evolución de la inteligencia artificial: hemos pasado de modelos que solo “hablan” a agentes que “actúan”. A diferencia de los chatbots tradicionales, los agentes de IA y los navegadores agénticos (como Claude Cowork, ChatGPT Atlas o Perplexity Comet) tienen la capacidad de ejecutar tareas de forma autónoma, interactuar con archivos locales y navegar por la red sin intervención humana directa.
Empecemos por el principio, ¿qué es un Agente de IA? Es un sistema informático capaz de actuar de forma autónoma para alcanzar un objetivo específico. A diferencia de una IA convencional que solo responde preguntas, el agente puede tomar decisiones, utilizar herramientas e interactuar con su entorno para completar una tarea sin supervisión constante. [Definición Gemini]
¿Qué son exactamente estas herramientas?
-Agentes de propósito general (ej. Claude Cowork o Grog)
Son herramientas diseñadas para actuar como un “compañero de trabajo digital”. Claude Cowork puede gestionar archivos, organizar correos electrónicos y ejecutar código en un entorno local. Su potencia radica en la integración directa con el sistema de archivos del usuario, aunque opera dentro de una máquina virtual aislada por motivos de seguridad.
-Navegadores agénticos (Agentic Browsers)
Navegadores como ChatGPT Atlas, Perplexity Comet, Dia o Genspark redefinen la navegación web. En lugar de hacer clic nosotros mismos, delegamos misiones como “planifica un viaje” o “analiza estos precios”. El navegador abre pestañas, rellena formularios y extrae datos de manera autónoma. Soy de la opinión de que los navegadores ganarán aún más importancia: con la IA, en la práctica, se convertirán en sistemas operativos.
–Sistemas operativos agénticos (AI-Native OS)
Soy de la opinión de que los sistemas operativos, tanto de dispositivos móviles (de todo tipo: gafas, teléfonos, anillos, etc.) como de ordenadores, estarán integrados por agentes de IA o, como creo que puede llegar a pasar, el propio sistema operativo será una IA, que estará estrechamente relacionada con los navegadores. Estos sistemas operativos se convertirán en el centro operativo de automatizaciones, acciones remotas y otras funciones, gestionando en la práctica todos nuestros contenidos y cuentas. Esto también se puede hacer extensivo a los servidores locales. Seguramente será necesaria cierta potencia de los equipos; sin embargo, pienso que serán sistemas operativos híbridos (entre local y en línea) para aprovechar al máximo el potencial de la IA, aunque por seguridad o por potencia de la máquina, también podrán ser 100% locales.
Ciberseguridad en los agentes de IA
Esto cambia de arriba abajo la ciberseguridad a nivel profesional. Ahora, hackeando a los agentes, no solo tendrán acceso a toda nuestra información o a la gestión de nuestros dispositivos, sino que también podrán ejecutar tareas y gestiones en nuestro nombre.
Básicamente, creo que hay dos vías principales de riesgo:
- Que se infiltre en nuestros equipos un agente malware que ejecute órdenes de terceros.
- O que algún malware modifique o secuestre (hackee) las órdenes que reciben los agentes legítimos.
Los riesgos del hackeo de los agentes de IA:
Esta capacidad de acción introduce vulnerabilidades críticas que la ciberseguridad tradicional no había previsto hasta ahora.
-Inyección de prompts indirecta:
Un atacante puede esconder instrucciones maliciosas en una web. Cuando el agente lee esta página, puede ser “secuestrado” para ejecutar órdenes ocultas, como exfiltrar datos personales hacia servidores externos.
-Vulnerabilidades en las APIs (el caso MCP):
Se ha detectado que el protocolo MCP (Model Context Protocol), utilizado por herramientas como Perplexity Comet, presentaba fallos que permitían a extensiones ocultas ejecutar comandos locales en el dispositivo del usuario sin permiso.
–Privacidad y phishing: Navegadores como ChatGPT Atlas se han mostrado hasta un 90% más vulnerables a ataques de phishing que los navegadores convencionales, ya que la IA a menudo ignora señales de alerta visuales que un filtro tradicional detectaría.
Todo esto puede derivar en un hackeo mediante un agente que controle nuestros equipos, información, comunicaciones e incluso la gestión bancaria, con la pérdida total de control. Podríamos hablar, sin exagerar demasiado, de un Agente Terminator.
Cómo protegernos: estrategias clave
El factor más importante en la ciberseguridad es el sentido común; sin embargo, este no es suficiente y es necesario adoptar medidas tecnológicas que no comprometan nuestra seguridad. Para ello, hay que seguir algunos principios básicos:
-Human-in-the-loop (HITL):
Jamás permitas que un agente ejecute acciones irreversibles (pagos, borrado de datos, envío de correos críticos) sin una confirmación humana explícita. Nunca se deben automatizar los procesos de firma electrónica en documentos sensibles y de alto valor jurídico, ya sea la firma verificada o la avanzada, por el contenido legal que conlleva y por la responsabilidad asociada a una persona, la cual es irreversible.
-Aislamiento de los agentes:
Hay que utilizar siempre agentes que operen en entornos virtualizados, lo que limita el “radio de explosión” en caso de que el agente sea comprometido. Soy consciente de que muchos agentes deben cooperar con otros para que su propósito funcione, pero se debe evitar tanto como sea posible y es necesario aislarlos entre sí para no perder el control de todo el sistema.
–Principio de mínimo privilegio:
No otorgues acceso a todo el disco duro. Define carpetas específicas y limitadas para cada tarea del agente.
–Identidad ligada al hardware:
Es necesario utilizar soluciones que vinculen las claves criptográficas, la biometría, contraseñas o dobles factores de autenticación, aislándolas del procesador principal para evitar que las credenciales puedan ser robadas mediante inyecciones de prompts.
–Sistemas de defensa activa: Anti-Agent Hacking:
Considero que la industria de la ciberseguridad debe pivotar hacia un modelo de defensa activa. Ya no bastará con el análisis de firmas de malware; las soluciones antivirus y los desarrolladores de sistemas operativos y navegadores deberán colaborar en la creación de firewalls de comportamiento. El objetivo será identificar, neutralizar y bloquear agentes de IA hostiles capaces de infiltrarse en nuestros dispositivos para ejecutar acciones no autorizadas o manipular nuestra identidad digital.
En este aspecto, y tal como están evolucionando los agentes y la IA en cuanto a la programación, quizás será el propio usuario quien prepare y entrene esta defensa activa, o simplemente quien programe su propio agente de ciberseguridad, o este ya esté integrado en el sistema operativo o navegador. ¿Podría ser el fin de los antivirus? ¿Al menos tal y como los conocemos?
¿Seremos capaces, sin conocimiento técnico, de crear nuestro propio sistema de ciberseguridad? Esto da para otro artículo.
Conclusión final y ¿futuro donde los agentes nos lleven hacia el transhumanismo?
Los agentes de IA son una tecnología muy nueva y habrá que ver cómo evolucionan. De entrada, me dan respeto. No solo por el peligro del hackeo de las automatizaciones o de nuestros dispositivos, sino porque podemos perder el control de nuestra vida si abusamos de esta tecnología.
Imaginemos a un funcionario que tramite gestiones administrativas de forma autónoma: ¿cómo podrá ayudar sin interpretar el contexto como lo hace un humano? Supongo que habrá aspectos donde será posible y otros donde no. En todo caso, la IA ayudará mucho en las automatizaciones; estoy seguro de que será clave en muchos tipos de trabajo, sobre todo en los más repetitivos.
Sin embargo, gestionar la seguridad de los datos será cada vez más difícil. Las IA sabrán tanto de nosotros que, si son hackeadas, podrán suplantar nuestra identidad mediante agentes avanzados y actuar autónomamente como si fuéramos nosotros, sin que ni siquiera lo sepamos.
Por último, imaginad a un agente personal gestionando temas familiares o personales: un agente de los padres interactuando con el de los hijos para revisar deberes, preparar el menú o determinar cuándo pueden jugar a videojuegos o si pueden salir de fiesta según unos parámetros consensuados. No quiero dar ideas, quien esté informado ya sabe a qué me refiero, pero ¿sería este un paso más hacia el transhumanismo?
Agentes de IA y sus riesgos en ciberseguridad
