Fine-tuning (Ajuste fino)

El fine-tuning es el proceso de tomar un modelo de IA ya preentrenado y reentrenarlo con un conjunto de datos propio para especializarlo en una tarea, un dominio o un estilo concretos, sin partir de cero.

Fine-tuning (Ajuste fino)

El fine-tuning es el proceso de reentrenar un modelo de IA ya preentrenado con tus propios datos para especializarlo en una tarea, dominio o estilo concretos. A diferencia del prompt o de RAG, modifica los pesos del modelo, por lo que el conocimiento queda "horneado" dentro de él y no hace falta repetir las instrucciones en cada consulta.

Fine-tuning no es lo mismo que entrenar un modelo desde cero. Partes de un modelo base que ya entiende el lenguaje y solo lo ajustas con un dataset relativamente pequeño. Tampoco es RAG: RAG inyecta contexto en el momento de responder sin tocar los pesos; el fine-tuning sí los cambia.

Actualizado: 31 de mayo de 2026

Cómo funciona el fine-tuning paso a paso

Eliges un modelo base preentrenado (por ejemplo Llama, Mistral, los modelos GPT vía API de OpenAI, o un modelo abierto que puedas alojar tú).
Preparas el dataset: pares de entrada-salida que representan exactamente el comportamiento deseado (preguntas y respuestas ideales, textos en tu tono de marca, clasificaciones correctas, etc.). La calidad del dataset importa más que la cantidad.
Entrenas: el modelo ajusta sus pesos para minimizar el error frente a tus ejemplos. Hoy esto casi siempre se hace con PEFT (Parameter-Efficient Fine-Tuning), normalmente LoRA o QLoRA, que entrenan solo unos pocos parámetros adicionales en lugar de los miles de millones del modelo completo.
Evalúas y despliegas: mides el rendimiento en un conjunto de validación y, si mejora, sirves el modelo ajustado en producción.

Fine-tuning vs. RAG vs. Prompt engineering

Criterio	Prompt engineering	RAG	Fine-tuning
Qué cambia	Solo las instrucciones	El contexto recuperado	Los pesos del modelo
Conocimiento actualizado	Limitado al corte de entrenamiento	Sí, en tiempo real	Solo hasta el reentrenamiento
Aprende estilo/comportamiento	Parcial	No	Sí, muy bien
Coste inicial	Nulo	Bajo-medio	Medio-alto (GPU)
Coste de actualización	Nulo	Bajo (reindexar)	Alto (reentrenar)
Cita fuentes	No	Sí	No
Mejor para	Tareas generales	Datos cambiantes y verificables	Tono, formato y tareas repetitivas

Tabla comparativa actualizada a mayo de 2026. No son excluyentes: muchos sistemas en producción combinan fine-tuning (para el estilo y el formato) con RAG (para el conocimiento actualizado).

Por qué importa el fine-tuning en 2026

2021 — año de LoRA, la técnica de ajuste fino eficiente más usada. LoRA fue presentada por un equipo de Microsoft en 2021 y popularizó el ajuste fino eficiente en parámetros: en lugar de actualizar todos los pesos, entrena matrices de bajo rango que se suman al modelo, reduciendo drásticamente la memoria necesaria (fuente: Hu et al., "LoRA: Low-Rank Adaptation of Large Language Models", Microsoft, 2021, arXiv:2106.09685).

Hasta 65B parámetros en una sola GPU de 48 GB. QLoRA (2023) combinó la cuantización en 4 bits con LoRA y demostró que se podía ajustar un modelo de 65.000 millones de parámetros en una única GPU de 48 GB manteniendo prácticamente el rendimiento del fine-tuning completo (fuente: Dettmers et al., "QLoRA: Efficient Finetuning of Quantized LLMs", NeurIPS 2023, arXiv:2305.14314). Esto abarató tanto el proceso que el fine-tuning dejó de ser exclusivo de las grandes empresas.

Tipos de fine-tuning

Fine-tuning completo (full fine-tuning): se actualizan todos los pesos. Máxima capacidad de adaptación, pero el más caro en cómputo y almacenamiento.
PEFT (LoRA, QLoRA, adapters): se entrena solo una pequeña fracción de parámetros. Es el estándar práctico en 2026 por su relación coste-resultado.
Instruction tuning: se ajusta el modelo con pares instrucción-respuesta para que siga mejor las órdenes del usuario.
RLHF / DPO (alineación): se afina el modelo según preferencias humanas para mejorar utilidad y seguridad; es el tipo de ajuste que convierte un modelo base en un asistente conversacional.

Casos de uso reales

Tono de marca: un modelo que escribe siempre con la voz y el estilo de tu empresa, sin tener que recordárselo en cada prompt.
Clasificación especializada: detectar la intención de tickets de soporte o etiquetar documentos legales o médicos con vocabulario muy específico.
Formato estricto de salida: generar JSON, código o informes con una estructura fija y fiable.
Idiomas o jergas poco representados: mejorar el rendimiento en un dominio técnico o un dialecto donde el modelo base falla.

El fine-tuning no es la solución cuando el problema es de conocimiento desactualizado o cambiante: para eso es mejor RAG. Tampoco arregla datos de mala calidad: un dataset con errores o sesgos los amplifica. Y como el conocimiento queda fijado en los pesos, actualizarlo obliga a reentrenar, mientras que con RAG basta con reindexar.

Cuándo usar fine-tuning (y cuándo no)

Usa fine-tuning cuando necesites que el modelo adopte un estilo, formato o comportamiento estable y repetitivo, o cuando el prompt se vuelve demasiado largo y costoso de repetir. Usa RAG cuando necesites conocimiento actualizado y verificable con citas a la fuente. Y empieza siempre por prompt engineering: muchas veces un buen prompt resuelve el problema sin coste de entrenamiento.

Conceptos relacionados

Para dominar el fine-tuning conviene entender antes qué es un LLM, en qué se diferencia de RAG, cómo encaja dentro del machine learning y el deep learning, y por qué el prompt engineering suele ser el primer paso antes de ajustar un modelo.

Preguntas frecuentes sobre fine-tuning

¿Fine-tuning o RAG? Depende del problema. Fine-tuning para estilo, formato y tareas repetitivas; RAG para conocimiento actualizado y trazable. A menudo se combinan.

¿Cuántos datos necesito para hacer fine-tuning? Menos de lo que parece: con técnicas como LoRA, unos cientos o pocos miles de ejemplos de alta calidad suelen bastar para tareas concretas. La calidad pesa más que el volumen.

¿Es caro hacer fine-tuning? Con LoRA y QLoRA se ha abaratado mucho: se pueden ajustar modelos grandes en una sola GPU. El fine-tuning completo de modelos enormes sí sigue siendo costoso.

¿El fine-tuning puede empeorar el modelo? Sí. Un dataset pequeño o sesgado puede provocar sobreajuste u "olvido catastrófico" de capacidades generales. Por eso es clave evaluar siempre contra un conjunto de validación antes de desplegar.