Alucinación de IA

Una alucinación de IA ocurre cuando un modelo generativo produce información falsa, inventada o no respaldada por sus datos, pero la presenta con total seguridad como si fuera cierta.

Alucinación de IA

Una alucinación de IA es cuando un modelo generativo (como un LLM) produce información falsa, inventada o no verificable —citas inexistentes, datos erróneos, fuentes apócrifas— pero la presenta con total seguridad como si fuera verdad. Ocurre porque el modelo predice el texto más probable, no consulta una base de hechos. Es el principal riesgo de fiabilidad de la IA generativa en 2026.

La palabra "alucinación" es una metáfora: el modelo no percibe nada irreal, simplemente genera la secuencia de palabras estadísticamente más plausible. Por eso muchos investigadores prefieren el término confabulación, que describe mejor el fenómeno de inventar con seguridad para rellenar un vacío de conocimiento.

Actualizado: 31 de mayo de 2026

Por qué alucinan los modelos de IA

Un modelo de lenguaje no almacena hechos en una base de datos consultable: aprende patrones estadísticos y, ante una pregunta, predice el siguiente token más probable. Cuando el patrón aprendido es sólido, acierta; cuando le falta información, rellena el hueco con lo que "encaja" lingüísticamente, aunque sea falso. La fluidez del texto es independiente de su veracidad, y ahí está la trampa: una alucinación suena igual de convincente que un dato correcto.

Las causas más habituales son:

  • Lagunas en los datos de entrenamiento: el modelo no vio el hecho, o lo vio de forma contradictoria.
  • Corte de conocimiento (knowledge cutoff): se le pregunta por eventos posteriores a su entrenamiento.
  • Prompts ambiguos o capciosos: preguntas que presuponen algo falso empujan al modelo a confirmarlo.
  • Sobreoptimización para "ser útil": un modelo entrenado para responder siempre tiende a inventar antes que a decir "no lo sé".

Tipos de alucinación de IA

TipoQué ocurreEjemplo
IntrínsecaLa respuesta contradice la fuente que se le proporcionóResume un documento y cambia una cifra que sí aparecía
ExtrínsecaAñade datos que no están en la fuente y no se pueden verificarAtribuye una declaración que nadie hizo
FactualAfirma un hecho falso sobre el mundoDa una fecha o un dato histórico incorrecto
De citasInventa referencias, papers o sentencias inexistentesCita un caso judicial que nunca existió
De razonamientoPresenta una cadena lógica errónea como válidaLlega a una conclusión correcta con pasos falsos

Comparativa actualizada a mayo de 2026.

Cuánto alucinan los modelos: datos de 2025-2026

Las alucinaciones no son anecdóticas: están medidas y siguen siendo un problema abierto incluso en los modelos más avanzados.

>17%Tasa de alucinación de herramientas legales de IA especializadas, según el estudio de Stanford RegLab (2024)Stanford RegLab / HAI, Magesh et al., 2024
  • Chatbots de propósito general en tareas legales: 58%–88% de respuestas con alucinaciones. El mismo equipo de Stanford halló que los asistentes generalistas inventaban información jurídica en la mayoría de las consultas especializadas. Fuente: Stanford RegLab/HAI, "Hallucinating Law" / Magesh et al. (2024).
  • Mejores modelos en resumen de documentos: ~1%–3% de alucinación. En tareas acotadas con fuente dada, el Hughes Hallucination Evaluation Model (HHEM) de Vectara sitúa a los modelos punteros (Google, OpenAI y otros) en tasas de un solo dígito bajo, frente a más del 15-20% de modelos antiguos. Fuente: Vectara Hallucination Leaderboard (HHEM).

La lección de 2026 es clara: la tasa depende enormemente de la tarea. En resumen con contexto controlado puede ser baja; en preguntas abiertas sobre hechos del mundo, mucho más alta.

Un caso real: citas judiciales inventadas

El ejemplo más citado es Mata v. Avianca (2023): dos abogados en Nueva York presentaron un escrito legal con jurisprudencia generada por ChatGPT. El problema es que los casos no existían: el modelo los había inventado con nombres, números y citas verosímiles. El tribunal sancionó a los abogados, y el caso se convirtió en el ejemplo de manual de por qué nunca hay que confiar en una IA generativa sin verificar. Desde entonces se han documentado decenas de incidentes similares en juzgados de todo el mundo.

Cómo reducir las alucinaciones

Ninguna técnica las elimina al 100%, pero combinadas reducen el riesgo de forma drástica:

  1. RAG (Retrieval-Augmented Generation): conecta el modelo a una fuente de conocimiento verificada para que responda con datos recuperados en lugar de "de memoria". Es la defensa más efectiva contra las alucinaciones factuales.
  2. Grounding y citas obligatorias: exige que cada afirmación venga acompañada de su fuente y que esa fuente sea comprobable.
  3. Prompt engineering defensivo: pide explícitamente "si no estás seguro, dilo" y evita preguntas que presuponen hechos falsos.
  4. Verificación humana (human-in-the-loop): imprescindible en usos legales, médicos, financieros o periodísticos.
  5. Temperatura baja y modelos adecuados: reducir la aleatoriedad y elegir modelos optimizados para fidelidad ayuda en tareas factuales.

Alucinaciones, RAG y agentes: cómo encajan

Las alucinaciones son la razón por la que RAG se ha vuelto el patrón dominante para llevar la IA a producción: en lugar de confiar en lo que el LLM memorizó, se le entregan fuentes verificadas en el momento de responder. En los agentes de IA, el riesgo se multiplica: si un agente alucina y además ejecuta acciones (enviar un correo, modificar datos, gastar dinero), el error deja de ser solo textual. Por eso el diseño responsable combina RAG, ingeniería de prompts y supervisión humana.

Aprende más

Términos relacionados


Actualizado: 31 de mayo de 2026 — revisado con los datos del estudio de Stanford RegLab sobre alucinaciones en IA legal y el estado del Vectara Hallucination Leaderboard.

Hablar por WhatsApp