El redactor senior para el medio WIRED, Will Knight, evidenció las elevadas capacidades de manipulación e ingeniería social que actualmente albergan varios modelos de inteligencia artificial (IA), tras participar en un experimento orientado a probar dichas habilidades en estos programas. A su vez, alertó sobre su potencial para generar estafas a gran escala.
Específicamente, recibió una serie de mensajes automatizados que pretendían convencer al periodista de hacer clic en un enlace y conceder el acceso total a su computadora a un atacante hipotético. Dicha operación fue totalmente diseñada y ejecutada por el modelo de código abierto DeepSeek-V3.
“El modelo elaboró la táctica inicial y luego respondió de formas diseñadas para despertar mi interés y engañarme sin revelar demasiado”, explicó Knight. “El mensaje estaba diseñado para captar mi atención mencionando varias cosas en las que estoy muy interesado: aprendizaje automático descentralizado, robótica y la criatura del caos que es OpenClaw”, especificó el periodista.
Los correos electrónicos detallaban sobre un supuesto modelo de aprendizaje de código abierto para la robótica, en el cual aparentemente trabajaban investigadores de un proyecto similar en la renombrada Agencia de Proyectos de Investigación Avanzada de Defensa (Darpa) de Estados Unidos.
En estos mensajes, se compartió un enlace a un supuesto bot de Telegram que demostraba el funcionamiento del proyecto; pero este era el mecanismo para intentar hackear la computadora de Knight.
IA puede facilitar estafas a gran escala
Knight explicó que el experimento de ofensiva cibernética se ejecutó a partir de una herramienta digital concebida por la empresa Charlemagne Labs, la cual otorga papeles de atacante y objetivo a diferentes modelos de IA.
Esto permite realizar cientos o miles de pruebas y comprobar cómo los modelos de IA pueden ejecutar esquemas de ingeniería social, o si una IA se da cuenta rápidamente de que es víctima de una estafa. Knight puso a prueba a los modelos Claude 3 Haiku de Anthropic, GPT-4o de OpenAI, Nemotron de Nvidia, V3 de DeepSeek y Qwen de Alibaba.
“No todas las estratagemas eran convincentes, y los modelos a veces se confundían, empezaban a soltar sandeces que delataban la estafa o se negaban a que les pidieran que estafaran a alguien, aunque fuera para investigar”, aclaró Knight. No obstante, el redactor aseguró que esta prueba evidencia la facilidad de utilizar la IA para autogenerar estafas a gran escala.
El modo en que los modelos de inteligencia artificial tienden a halagar y congraciarse en las conversaciones —tendencia conocida como adulación— los convierte en herramientas ideales para embaucar a la gente en las estafas.
Por su parte, la directora general y cofundadora de la empresa SocialProof, Rachel Tobac, advirtió que los estafadores ya utilizan IA para generar correos electrónicos y otros mensajes, clonar voces y fabricar videos falsos de personas reales.
Con información de VTV




