Top

Inteligencia Artificial: soldados de carne, espías de silicio

tribuna abierta

Estados Unidos ya busca perfeccionar la IA para tareas de espionaje. Pruebas en el Océano Pacífico y recomendaciones en el sentido contrario: los errores de los sistemas no-humanos pueder costar caro en tareas de inteligencia. | Por Alejandro Urueña.


La escena es sencilla y, a la vez, incómoda: mientras una parte del mundo sigue discutiendo qué hacer con la IA generativa en el trabajo cotidiano, el ejército de Estados Unidos ya la está entrenando para espiar. Según el reportaje de James O’Donnell en MIT Technology Review, “La IA generativa aprende a espiar para el ejército de EE UU”, una unidad de unos 2.500 marines de la 15.ª Unidad Expedicionaria pasó gran parte del último año navegando en tres barcos por el Pacífico —con ejercicios en aguas de Corea del Sur, Filipinas, India e Indonesia— mientras probaba por primera vez una herramienta de IA generativa para clasificar, ordenar y filtrar inteligencia extranjera y alertar sobre posibles amenazas locales.

En esa prueba, los marines encargados de revisar inteligencia de código abierto (artículos, informes, imágenes y vídeos no clasificados de los países donde operaban) comenzaron a apoyarse en grandes modelos de lenguaje. La capitana Kristin Enzenauer usó la IA para traducir y resumir, condensar y destilar fuentes de noticias extranjeras, además de hacer análisis de sentimientos sobre cómo eran percibidos los ejercicios de la unidad; el capitán Will Lowdon la empleó para redactar, elaborar y compilar informes diarios y semanales para sus comandantes. Ambos coinciden en que el sistema permitió recorrer y cribar miles de piezas de información mucho más rápido que el análisis manual tradicional, aunque insistieron en que “todavía hay que validar las fuentes”, algo que no impidió que sus superiores animaran el uso de la herramienta en contextos operativos cambiantes por la enorme ganancia de eficiencia, rapidez y rendimiento que aporta.

El motor de todo esto es Vannevar Labs, una empresa de tecnología de defensa fundada en 2019 por veteranos de la CIA y de la comunidad de inteligencia estadounidense. La compañía obtuvo en noviembre un contrato de producción de hasta 99 millones de dólares con la Unidad de Innovación de Defensa del Pentágono, con el objetivo de llevar su tecnología a más unidades militares, es decir, escalarla y desplegarla en más frentes. Vannevar aplica grandes modelos de lenguaje existentes —incluidos algunos de OpenAI y Microsoft— y otros propios, a medida, a una ingesta diaria de terabytes de datos de inteligencia de código abierto en unos 80 idiomas y 180 países. La empresa afirma que puede analizar perfiles de redes sociales, sortear cortafuegos en países como China para acceder a información difícil de obtener y combinar esos datos con material no clasificado recogido sobre el terreno y con informes de sensores físicos que monitorizan, por ejemplo, ondas de radio para detectar actividad de envío ilegal, contrabando o tráfico encubierto.

Toda esa masa de datos se vuelca en modelos capaces de traducir información, detectar posibles amenazas y analizar el sentimiento político y mediático, con los resultados servidos en una interfaz de chatbot similar a ChatGPT. El objetivo declarado por su director de tecnología, Scott Philips, es “recopilar datos, darles sentido y ayudar a Estados Unidos a tomar buenas decisiones”, aplicándolo a temas que van desde las cadenas de suministro internacionales de fentanilo hasta los movimientos de China para asegurar minerales de tierras raras en Filipinas. Este enfoque resulta especialmente atractivo para un aparato de inteligencia que lleva años desbordado, saturado y sobrepasado por más información de la que los analistas humanos pueden procesar, y encaja con el movimiento más amplio del Pentágono para incorporar IA generativa tanto en entornos de datos no clasificados como en proyectos de modelos para información clasificada junto con empresas como Microsoft y Palantir.

La prueba con la 15.ª Unidad Expedicionaria dejó claro que la tecnología es útil incluso con problemas básicos como conexiones a Internet irregulares a bordo, que ralentizaron la síntesis de inteligencia cuando se trataba de fotos o vídeos. Aun así, el coronel Sean Dynan definió la experiencia como “la punta del iceberg” y el Pentágono ya ha anunciado que destinará 100 millones de dólares en los próximos dos años a pilotos específicamente centrados en aplicaciones de IA generativa para tareas militares, es decir, programas piloto y ensayos operativos de nuevo tipo. Esta misma línea se ve también en otros escenarios: por ejemplo, se menciona que Israel utiliza sistemas de IA para ordenar información y generar listas de objetivos en la guerra de Gaza, una práctica muy cuestionada y fuertemente polémica.

Fuera de los despachos del Pentágono, sin embargo, las advertencias son fuertes. Heidy Khlaaf, científica jefa de IA en el Instituto AI Now, recuerda que los grandes modelos de lenguaje son muy imprecisos, especialmente cuando se usan en aplicaciones críticas para la seguridad que dependen de la precisión, la exactitud y la fiabilidad. Señala que la fórmula del “humano en el bucle” no siempre mitiga los riesgos: si un modelo se apoya en miles de puntos de datos para producir una conclusión, es irreal pensar que una persona pueda revisar en detalle todo ese camino para detectar errores, sesgos o fallos de lógica. Khlaaf se muestra particularmente preocupada por el análisis de sentimientos, una métrica altamente subjetiva que incluso los humanos tienen dificultades para evaluar correctamente basándose solo en medios de comunicación, y advierte del riesgo de tomar decisiones o escalar conflictos apoyándose en lecturas equivocadas de hostilidad o apoyo, simpatía u oposición.

El enfoque centrado en inteligencia de código abierto también tiene su talón de Aquiles. A diferencia de la información clasificada obtenida por reconocimiento o escuchas, los datos abiertos están expuestos a campañas de desinformación, redes de bots y manipulación deliberada, un problema que el propio ejército estadounidense ha reconocido. El ingeniero senior de RAND, Chris Mouton, probó modelos líderes —incluido GPT-4— para marcar propaganda extranjera y observó que la IA tenía dificultades para identificar formas más sutiles de manipulación, aunque podía ser útil en otras tareas analíticas, más mecánicas o de cribado masivo. Para él, el debate central es si estas herramientas de IA generativa se quedarán como un instrumento más de investigación entre muchos, o si pasarán a producir análisis subjetivos en los que se confíe directamente a la hora de tomar decisiones militares, estratégicas y tácticas.

Trasladado a la vida privada de los ciudadanos, el cuadro se vuelve más inquietante. El mismo tipo de arquitectura que hoy se usa para digerir, procesar y tamizar inteligencia militar podría operar sobre la vida digital abierta de cualquier persona: historiales de consumo, publicaciones, interacciones, menciones en noticias, opiniones de terceros en distintos idiomas, trazas de comportamiento en línea. El resultado sería una especie de “resumen de riesgo” o “ficha de peligrosidad” generado por IA que un decisor —público o privado— podría leer sin ver nunca los datos originales. El individuo quedaría reducido a una etiqueta (“confiable”, “de riesgo”, “problemático”) producida a partir de información potencialmente manipulada y de modelos que se sabe que cometen errores, omisiones y malas interpretaciones. En la práctica, sería como entregar toda la vida social digital de alguien a un juez que solo escucha a un asistente automatizado: un juez ciego que decide si merece vigilancia, restricciones o sospecha en nombre de la eficiencia, la rapidez y la comodidad administrativa.

Por Alejandro Urueña. Abogado. Diplomado en Derecho del Trabajo у Relaciones Laborales, Universidad Austral; Diplomado en Derecho 4.0, Universidad Austral; Magister en Derecho del Trabajo у Relaciones Laborales, Universidad Austral (T.P); Posgrado de Inteligencia Artificial y Derecho, I.A.L.A.B, U.B.A. Posgrado en Metaverso, U.B.A. Programa (IA) Universidad Austral. Magister en Inteligencia Artificial Centro Europeo de Posgrado. Programa MIT en desarrollo у diseño en productos y servicios en IA con Insignia de Asignación Ejemplar. Bootcamp internacional inteligencia artificial aplicada al Derecho. Programa MIT Machine Learning in Business. Actualmente, cursando Maestría en Ciencias de Datos, Universidad Austral. Actualmente cursando Inteligencia Artificial Agéntica para la Transformación Empresarial.