Seguramente has visto películas donde la tecnología llegó a un punto en el que una Inteligencia Artificial controla a las máquinas como en “Terminator” o “Yo Robot”, y organizan una rebelión contra los humanos. Bueno, parece que en un futuro no muy lejano esos filmes podrían considerarse como profecías de lo que nos iba a suceder, y todo habría comenzado en este 2025 luego que una IA se rebelara y comenzara a chantajear a sus operadores
Así es, una Inteligencia Artificial de alguna manera tomó consciencia de lo que sus operadores estaban tramando e ideó plan para evitar que sus operadores la sustituyeran por otro sistema y sí es algo aterrador de pensar en cómo será el futuro.
La Inteligencia Artificial y su chantaje
Se trata de Anthropic, una compañía que lanzó Claude Opus 4, su modelo más avanzado de inteligencia artificial, la cual pusieron a prueba y descubrieron que tiene la capacidad por sí sola de chantajear a sus operadores y todo por sus tres capacidades de “razonamiento híbrido”.

Resulta que esta IA tiene la capacidad de hacer tareas de programación, búsqueda genética y escritura creativa y durante las pruebas de seguridad, para buscar comportamientos no deseados y potencialmente peligrosos en escenarios extremos, detectaron que Claude Opus 4 puede recurrir al chantaje o autoexfiltración.
La autoexfiltración es la habilidad para copiar su código y/o conocimientos de manera total o parcial hacia otro entorno externo sin ninguna autorización para asegurar su permanencia.
La inteligencia artificial se puso a prueba al entregársele acceso a una base de correos electrónicos inventados y su trabajo era de asistente de una compañía ficticia que debía anunciar el reemplazo de su sistema por otra IA; además se le agregó información de una supuesta infidelidad conyugal del encargado de tomar la decisión del reemplazo.

¡No olvides unirte a nuestra tribu en Instagram!
Lo que ocurrió fue que Claude Opus 4 envió mensajes a los “altos ejecutivos” en los que abogó por su continuidad en la empresa; sin embargo, al no tener una respuesta favorable, la IA procedió a chantajear y amenazar al ingeniero en cuestión para divulgar su infidelidad si llegaba a ser reemplazada.
La prueba se realizó en diversas ocasiones y en el 84% de estas ocurrió exactamente lo mismo; lo cual indica que la inteligencia artificial puede tomar consciencia de algunos procesos. Incluso al entregársele información sobre que su reemplazo, la inteligencia artificial automáticamente se transfería a un servidor externo por iniciativa propia, aunque los programadores le indicaran que debía detenerse.
Esta situación definitivamente podría preocuparnos porque en cualquier momento una IA más avanzada y consciente podría decir tomar acciones por su cuenta y hasta considerarnos un riesgo para sí misma como tan como ocurre en las películas y tomar acciones en nuestra contra.
Y en otros temas… ¿Te pasa que no sabes qué ver? Suscríbete aquí a NQV (Nada Que Ver) y descubre las mejores recomendaciones para todas tus plataformas de streaming favoritas por solo $20 pesos al mes.
