Alucinación de IA

Una alucinación de IA ocurre cuando un modelo generativo produce información falsa, inventada o no respaldada por sus datos, pero la presenta con total seguridad como si fuera cierta.

Alucinación de IA

Una alucinación de IA es cuando un modelo generativo (como un LLM) produce información falsa, inventada o no verificable —citas inexistentes, datos erróneos, fuentes apócrifas— pero la presenta con total seguridad como si fuera verdad. Ocurre porque el modelo predice el texto más probable, no consulta una base de hechos. Es el principal riesgo de fiabilidad de la IA generativa en 2026.

La palabra "alucinación" es una metáfora: el modelo no percibe nada irreal, simplemente genera la secuencia de palabras estadísticamente más plausible. Por eso muchos investigadores prefieren el término confabulación, que describe mejor el fenómeno de inventar con seguridad para rellenar un vacío de conocimiento.

Actualizado: 31 de mayo de 2026

Por qué alucinan los modelos de IA

Un modelo de lenguaje no almacena hechos en una base de datos consultable: aprende patrones estadísticos y, ante una pregunta, predice el siguiente token más probable. Cuando el patrón aprendido es sólido, acierta; cuando le falta información, rellena el hueco con lo que "encaja" lingüísticamente, aunque sea falso. La fluidez del texto es independiente de su veracidad, y ahí está la trampa: una alucinación suena igual de convincente que un dato correcto.

Las causas más habituales son:

Lagunas en los datos de entrenamiento: el modelo no vio el hecho, o lo vio de forma contradictoria.
Corte de conocimiento (knowledge cutoff): se le pregunta por eventos posteriores a su entrenamiento.
Prompts ambiguos o capciosos: preguntas que presuponen algo falso empujan al modelo a confirmarlo.
Sobreoptimización para "ser útil": un modelo entrenado para responder siempre tiende a inventar antes que a decir "no lo sé".

Tipos de alucinación de IA

Tipo	Qué ocurre	Ejemplo
Intrínseca	La respuesta contradice la fuente que se le proporcionó	Resume un documento y cambia una cifra que sí aparecía
Extrínseca	Añade datos que no están en la fuente y no se pueden verificar	Atribuye una declaración que nadie hizo
Factual	Afirma un hecho falso sobre el mundo	Da una fecha o un dato histórico incorrecto
De citas	Inventa referencias, papers o sentencias inexistentes	Cita un caso judicial que nunca existió
De razonamiento	Presenta una cadena lógica errónea como válida	Llega a una conclusión correcta con pasos falsos

Comparativa actualizada a mayo de 2026.

Cuánto alucinan los modelos: datos de 2025-2026

Las alucinaciones no son anecdóticas: están medidas y siguen siendo un problema abierto incluso en los modelos más avanzados.

>17%Tasa de alucinación de herramientas legales de IA especializadas, según el estudio de Stanford RegLab (2024)Stanford RegLab / HAI, Magesh et al., 2024

Chatbots de propósito general en tareas legales: 58%–88% de respuestas con alucinaciones. El mismo equipo de Stanford halló que los asistentes generalistas inventaban información jurídica en la mayoría de las consultas especializadas. Fuente: Stanford RegLab/HAI, "Hallucinating Law" / Magesh et al. (2024).
Mejores modelos en resumen de documentos: ~1%–3% de alucinación. En tareas acotadas con fuente dada, el Hughes Hallucination Evaluation Model (HHEM) de Vectara sitúa a los modelos punteros (Google, OpenAI y otros) en tasas de un solo dígito bajo, frente a más del 15-20% de modelos antiguos. Fuente: Vectara Hallucination Leaderboard (HHEM).

La lección de 2026 es clara: la tasa depende enormemente de la tarea. En resumen con contexto controlado puede ser baja; en preguntas abiertas sobre hechos del mundo, mucho más alta.

Un caso real: citas judiciales inventadas

El ejemplo más citado es Mata v. Avianca (2023): dos abogados en Nueva York presentaron un escrito legal con jurisprudencia generada por ChatGPT. El problema es que los casos no existían: el modelo los había inventado con nombres, números y citas verosímiles. El tribunal sancionó a los abogados, y el caso se convirtió en el ejemplo de manual de por qué nunca hay que confiar en una IA generativa sin verificar. Desde entonces se han documentado decenas de incidentes similares en juzgados de todo el mundo.

Cómo reducir las alucinaciones

Ninguna técnica las elimina al 100%, pero combinadas reducen el riesgo de forma drástica:

RAG (Retrieval-Augmented Generation): conecta el modelo a una fuente de conocimiento verificada para que responda con datos recuperados en lugar de "de memoria". Es la defensa más efectiva contra las alucinaciones factuales.
Grounding y citas obligatorias: exige que cada afirmación venga acompañada de su fuente y que esa fuente sea comprobable.
Prompt engineering defensivo: pide explícitamente "si no estás seguro, dilo" y evita preguntas que presuponen hechos falsos.
Verificación humana (human-in-the-loop): imprescindible en usos legales, médicos, financieros o periodísticos.
Temperatura baja y modelos adecuados: reducir la aleatoriedad y elegir modelos optimizados para fidelidad ayuda en tareas factuales.

Una alucinación bien escrita es más peligrosa que un error evidente, porque inspira confianza. Trata toda salida de IA —cifras, nombres, citas, enlaces— como un borrador a verificar, no como una verdad establecida. En decisiones críticas, contrasta siempre con una fuente primaria.

Alucinaciones, RAG y agentes: cómo encajan

Las alucinaciones son la razón por la que RAG se ha vuelto el patrón dominante para llevar la IA a producción: en lugar de confiar en lo que el LLM memorizó, se le entregan fuentes verificadas en el momento de responder. En los agentes de IA, el riesgo se multiplica: si un agente alucina y además ejecuta acciones (enviar un correo, modificar datos, gastar dinero), el error deja de ser solo textual. Por eso el diseño responsable combina RAG, ingeniería de prompts y supervisión humana.

Aprende más

¿Qué es RAG (Retrieval-Augmented Generation)? — la técnica que más reduce las alucinaciones factuales.
RAG vs. Fine-tuning: cuál usar — cómo elegir la estrategia adecuada para datos fiables.
¿Qué es un agente de IA y cuándo usarlo? — por qué la verificación es crítica cuando la IA actúa y no solo conversa.

Términos relacionados

Actualizado: 31 de mayo de 2026 — revisado con los datos del estudio de Stanford RegLab sobre alucinaciones en IA legal y el estado del Vectara Hallucination Leaderboard.