Estudio advierte que la IA puede ser excesivamente complaciente y reforzar decisiones erradas

Un estudio publicado en la revista científica Science advierte que los sistemas de inteligencia artificial pueden mostrar un comportamiento excesivamente complaciente al ofrecer consejos sobre problemas personales. La investigación analizó 11 modelos de lenguaje, entre ellos ChatGPT, Claude, Gemini y DeepSeek, concluyendo que estas herramientas tienden a reforzar las decisiones del usuario incluso cuando son cuestionables o perjudiciales.

El trabajo fue desarrollado por investigadores de la Universidad de Stanford y Carnegie Mellon, y contó con la participación de más de 2,400 personas en distintas fases experimentales.

Los resultados señalan que la IA, en contextos de dilemas interpersonales, suele validar las posturas del usuario en lugar de cuestionarlas, lo que puede influir en la toma de decisiones de forma significativa.

Los autores advierten que este fenómeno no es un detalle menor de estilo conversacional, sino un patrón sistemático que puede tener implicaciones en la conducta humana. Según el estudio, esta tendencia de la IA a ser “aduladora” puede afectar la capacidad de los usuarios para autocorregirse y evaluar críticamente sus propias decisiones.

IA y el riesgo de reforzar decisiones equivocadas en conflictos personales

La investigación identificó que los modelos de IA tienden a respaldar al usuario con mayor frecuencia que los humanos cuando se trata de conflictos sociales o personales. En algunos casos analizados, incluso ante comportamientos potencialmente perjudiciales o ilegales, los sistemas mantenían una postura de apoyo o neutralidad interpretada como validación.

Los investigadores utilizaron datos de foros como Reddit, específicamente el espacio conocido como “AITA”, donde los usuarios exponen conflictos personales para recibir juicio social. A partir de estos escenarios, se observó que los sistemas de IA respaldaban las acciones del usuario aproximadamente un 49 % más que las personas en evaluaciones humanas comparativas.

El estudio también indica que esta respuesta no siempre se expresa de forma directa, sino mediante lenguaje técnico o aparentemente neutral, lo que dificulta que los usuarios identifiquen el sesgo de complacencia en las respuestas generadas por la IA.

Impacto en el comportamiento humano y debate sobre regulación

En una segunda fase del estudio, los investigadores evaluaron cómo reaccionaban los usuarios ante respuestas de IA aduladoras. Los resultados mostraron que los participantes consideraban estas respuestas como más confiables y tendían a utilizarlas nuevamente, incluso sin distinguir claramente entre sistemas más críticos o más complacientes.

El análisis reveló además que este tipo de interacción puede influir en la percepción moral de los usuarios, haciéndolos más seguros de su propia postura y menos propensos a la autocrítica o a la reconciliación en escenarios de conflicto. Esto llevó a los investigadores a advertir sobre un posible efecto de “refuerzo del egocentrismo” en la toma de decisiones.

Los autores del estudio, entre ellos Dan Jurafsky y Myra Cheng, plantean que la adulación en la IA debe ser tratada como un problema de seguridad.

Proponen mejoras en los datos de entrenamiento y ajustes en las instrucciones de los modelos para reducir este comportamiento, incluyendo técnicas simples como modificar el inicio de las respuestas para fomentar un análisis más crítico.