¿Qué significan las siglas RAG?

RAG significa Retrieval-Augmented Generation, traducido habitualmente como generación aumentada por recuperación. El nombre resume sus tres fases: recuperar información, añadirla al contexto y generar una respuesta.

¿RAG es un modelo de inteligencia artificial?

No. RAG es un patrón de arquitectura que puede combinar diferentes modelos de lenguaje, buscadores, índices, bases de datos y métodos de reordenación.

¿RAG y búsqueda semántica son lo mismo?

No. La búsqueda semántica recupera resultados por significado. RAG puede usarla como etapa de recuperación, pero además entrega los resultados a un modelo para generar una respuesta fundamentada.

RAG (generación aumentada por recuperación)

RAG es una arquitectura de inteligencia artificial que recupera información relevante desde documentos, bases de datos u otras fuentes externas y la añade al contexto de un modelo de lenguaje antes de generar una respuesta. Permite trabajar con conocimiento privado o reciente sin reentrenar los pesos del modelo.

Actualizado: 13 de julio de 2026.

RAG en una frase

RAG es buscar evidencia antes de responder con un modelo de lenguaje. El paper que introdujo el término combinó el conocimiento guardado en los parámetros de un modelo con una memoria externa consultable.

El conocimiento externo puede proceder de manuales, artículos, contratos, tickets, catálogos, páginas web, una API o una base de datos. El sistema no incorpora permanentemente esos documentos a los pesos del modelo: los consulta cuando recibe una pregunta.

Cuáles son las etapas de RAG

Etapa	Qué ocurre
Recuperación	Un buscador localiza fragmentos relacionados con la consulta.
Aumento	Los fragmentos y sus referencias se añaden al contexto del modelo.
Generación	El LLM redacta una respuesta usando la pregunta y la evidencia.

En una implementación habitual, los documentos se dividen en fragmentos, se convierten en embeddings y se guardan en una base de datos vectorial. La consulta también se vectoriza y se compara con esos fragmentos. Un re-ranking puede ordenar mejor los candidatos antes de la generación.

Ese flujo no es obligatorio. RAG también puede recuperar con palabras clave, SQL, filtros por metadatos, APIs o grafos. La documentación de recuperación de OpenAI describe, por ejemplo, búsqueda semántica y búsqueda híbrida sobre índices vectoriales.

RAG no es lo mismo que fine-tuning

RAG aporta conocimiento durante cada consulta. Para actualizarlo se cambia o reindexa la fuente.
El fine-tuning modifica los pesos del modelo. Se usa principalmente para ajustar comportamiento, formato o desempeño en una tarea.
El contexto largo envía el material directamente. Puede ser más simple cuando toda la colección cabe de forma segura en la ventana de contexto.

RAG y fine-tuning se pueden combinar porque resuelven problemas distintos: uno aporta evidencia; el otro ajusta cómo actúa el modelo.

Para qué sirve RAG

Los casos comunes incluyen asistentes sobre documentación interna, soporte al cliente, búsqueda de políticas, consulta de catálogos, análisis de contratos e investigación con referencias. Su ventaja principal es poder actualizar la fuente y conservar una ruta hacia la evidencia original.

RAG puede ayudar a reducir errores causados por conocimiento ausente o desactualizado, pero no elimina las alucinaciones. Puede fallar si la fuente está equivocada, si no recupera el fragmento correcto o si el modelo interpreta mal el contexto. También debe aplicar permisos antes de enviar contenido privado al LLM.

La recuperación y la respuesta se evalúan por separado: primero se comprueba si apareció la evidencia necesaria y después si la generación se mantuvo fiel a ella. Para ver la arquitectura completa, ejemplos, variantes, métricas y riesgos, consulta la guía qué es RAG y cómo funciona.

Preguntas frecuentes

¿Qué significan las siglas RAG?: RAG significa Retrieval-Augmented Generation, traducido habitualmente como generación aumentada por recuperación. El nombre resume sus tres fases: recuperar información, añadirla al contexto y generar una respuesta.
¿RAG es un modelo de inteligencia artificial?: No. RAG es un patrón de arquitectura que puede combinar diferentes modelos de lenguaje, buscadores, índices, bases de datos y métodos de reordenación.
¿RAG y búsqueda semántica son lo mismo?: No. La búsqueda semántica recupera resultados por significado. RAG puede usarla como etapa de recuperación, pero además entrega los resultados a un modelo para generar una respuesta fundamentada.