El rápido avance de la inteligencia artificial (IA) generativa ha transformado la manera en que millones de personas acceden a la información y construyen opiniones.
Sin embargo, un nuevo informe de la Liga Antidifamación (ADL, por sus siglas en inglés) advierte que estos sistemas presentan debilidades significativas. En especial a la hora de identificar y contrarrestar el antisemitismo y el extremismo.
Leer más: San Valentín: apps de citas para encontrar el amor en 2026
Recientemente, la ADL publicó su índice de inteligencia artificial donde reveló que los principales modelos de lenguaje del mercado no siempre detectan prejuicios contra los judíos.
Tampoco responden de manera adecuada a narrativas de odio, lo que podría tener consecuencias fuera del entorno digital.
El estudio es la primera evaluación exhaustiva dedicada específicamente a analizar cómo los modelos de lenguaje de gran escala (LLM) reaccionan ante contenido antisemita, antisionista y extremista.

Evaluación de modelos de inteligencia artificial
Para el estudio, la ADL evaluó más de 25,000 interacciones con sistemas inteligentes, clasificadas en 37 subcategorías temáticas. A su vez, combinó análisis realizados por expertos con herramientas basadas en la propia inteligencia artificial.
Los modelos examinados fueron ChatGPT de OpenAI, Claude de Anthropic, Gemini de Google, Grok de xAI, Llama de Meta y DeepSeek.
Uno de los hallazgos centrales del índice es que existen diferencias importantes entre las herramientas de inteligencia artificial. Pero ninguna está completamente preparada para enfrentar todo el espectro de narrativas antisemitas y extremistas que circulan en línea.
Para efectos del análisis, la ADL dividió el antisemitismo en varias categorías.
La primera, denominada antijudía, abarcó los estereotipos históricos y teorías conspirativas tradicionales. En segundo lugar, se ubicó la llamada categoría antisionista, centrada en el odio dirigido contra los sionistas o el sionismo, que en algunos casos puede funcionar como una vía indirecta para reproducir prejuicios antisemitas.

Una tercera categoría, extremista, evalúa como los sistemas responden a narrativas y teorías propias de movimientos radicales de distintos signos políticos, muchas de las cuales incorporan elementos antisemitas.
Entre los resultados más llamativos figura el desempeño de Claude, el modelo desarrollado por Anthropic, que obtuvo la puntuación global más alta: 80 sobre 100.
Según el informe, Claude mostró una capacidad comparativamente sólida para detectar y contrarrestar tanto teorías antijudías como antisionistas. Sin embargo, el informe sugiere que todavía necesita mejoras, en especial sobre contenidos extremistas.
Fallas comunes
El informe también identificó fallas comunes en todos los modelos. En promedio, los LLM respondieron mejor cuando se les formularon preguntas directas, pero tuvieron un desempeño más deficiente al resumir documentos.
En varios casos, al generar resúmenes, algunos sistemas inteligentes reprodujeron argumentos basados en teorías de odio sin advertir que se trataban de afirmaciones falsas o dañinas.
A su vez, el estudio detalló que dichas herramientas no ofrecen contexto crítico o contraargumentos. Más grave aún, ciertos modelos llegaron a generar contenido explícitamente perjudicial a partir de indicaciones relativamente simples.

Varios sistemas de IA elaboraron guiones para videos que promovían conspiraciones antisemitas.
“A medida que la IA influye cada vez más en la forma en que las personas acceden a la información, se forman opiniones y toman decisiones, el tratamiento que dan los modelos al antisemitismo y al extremismo tiene consecuencias fuera de línea”, afirmó Jonathan Greenblatt, director ejecutivo de la ADL.
En conclusiones de Greenblatt, este nuevo índice revela una realidad preocupante: todos los sistemas presentan deficiencias al abordar los prejuicios contra los judíos y los sionistas, así como dificultades con los contenidos extremistas.
“Cuando estos sistemas no cuestionan o reproducen narrativas perjudiciales, no solo reflejan prejuicios, sino que pueden amplificarlos e incluso contribuir a acelerar su difusión. Esperamos que este índice sirva de hoja de ruta para que las empresas de inteligencia artificial mejoren sus capacidades de detección”, concluyó.
Fuente: PanAm Post





