Fine-tuning (Ajuste fino)
El fine-tuning es el proceso de tomar un modelo de IA ya preentrenado y reentrenarlo con un conjunto de datos propio para especializarlo en una tarea, un dominio o un estilo concretos, sin partir de cero.
Fine-tuning (Ajuste fino)
El fine-tuning es el proceso de reentrenar un modelo de IA ya preentrenado con tus propios datos para especializarlo en una tarea, dominio o estilo concretos. A diferencia del prompt o de RAG, modifica los pesos del modelo, por lo que el conocimiento queda "horneado" dentro de él y no hace falta repetir las instrucciones en cada consulta.
Fine-tuning no es lo mismo que entrenar un modelo desde cero. Partes de un modelo base que ya entiende el lenguaje y solo lo ajustas con un dataset relativamente pequeño. Tampoco es RAG: RAG inyecta contexto en el momento de responder sin tocar los pesos; el fine-tuning sí los cambia.
Actualizado: 31 de mayo de 2026
Cómo funciona el fine-tuning paso a paso
- Eliges un modelo base preentrenado (por ejemplo Llama, Mistral, los modelos GPT vía API de OpenAI, o un modelo abierto que puedas alojar tú).
- Preparas el dataset: pares de entrada-salida que representan exactamente el comportamiento deseado (preguntas y respuestas ideales, textos en tu tono de marca, clasificaciones correctas, etc.). La calidad del dataset importa más que la cantidad.
- Entrenas: el modelo ajusta sus pesos para minimizar el error frente a tus ejemplos. Hoy esto casi siempre se hace con PEFT (Parameter-Efficient Fine-Tuning), normalmente LoRA o QLoRA, que entrenan solo unos pocos parámetros adicionales en lugar de los miles de millones del modelo completo.
- Evalúas y despliegas: mides el rendimiento en un conjunto de validación y, si mejora, sirves el modelo ajustado en producción.
Fine-tuning vs. RAG vs. Prompt engineering
| Criterio | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| Qué cambia | Solo las instrucciones | El contexto recuperado | Los pesos del modelo |
| Conocimiento actualizado | Limitado al corte de entrenamiento | Sí, en tiempo real | Solo hasta el reentrenamiento |
| Aprende estilo/comportamiento | Parcial | No | Sí, muy bien |
| Coste inicial | Nulo | Bajo-medio | Medio-alto (GPU) |
| Coste de actualización | Nulo | Bajo (reindexar) | Alto (reentrenar) |
| Cita fuentes | No | Sí | No |
| Mejor para | Tareas generales | Datos cambiantes y verificables | Tono, formato y tareas repetitivas |
Tabla comparativa actualizada a mayo de 2026. No son excluyentes: muchos sistemas en producción combinan fine-tuning (para el estilo y el formato) con RAG (para el conocimiento actualizado).
Por qué importa el fine-tuning en 2026
2021 — año de LoRA, la técnica de ajuste fino eficiente más usada. LoRA fue presentada por un equipo de Microsoft en 2021 y popularizó el ajuste fino eficiente en parámetros: en lugar de actualizar todos los pesos, entrena matrices de bajo rango que se suman al modelo, reduciendo drásticamente la memoria necesaria (fuente: Hu et al., "LoRA: Low-Rank Adaptation of Large Language Models", Microsoft, 2021, arXiv:2106.09685).
Hasta 65B parámetros en una sola GPU de 48 GB. QLoRA (2023) combinó la cuantización en 4 bits con LoRA y demostró que se podía ajustar un modelo de 65.000 millones de parámetros en una única GPU de 48 GB manteniendo prácticamente el rendimiento del fine-tuning completo (fuente: Dettmers et al., "QLoRA: Efficient Finetuning of Quantized LLMs", NeurIPS 2023, arXiv:2305.14314). Esto abarató tanto el proceso que el fine-tuning dejó de ser exclusivo de las grandes empresas.
Tipos de fine-tuning
- Fine-tuning completo (full fine-tuning): se actualizan todos los pesos. Máxima capacidad de adaptación, pero el más caro en cómputo y almacenamiento.
- PEFT (LoRA, QLoRA, adapters): se entrena solo una pequeña fracción de parámetros. Es el estándar práctico en 2026 por su relación coste-resultado.
- Instruction tuning: se ajusta el modelo con pares instrucción-respuesta para que siga mejor las órdenes del usuario.
- RLHF / DPO (alineación): se afina el modelo según preferencias humanas para mejorar utilidad y seguridad; es el tipo de ajuste que convierte un modelo base en un asistente conversacional.
Casos de uso reales
- Tono de marca: un modelo que escribe siempre con la voz y el estilo de tu empresa, sin tener que recordárselo en cada prompt.
- Clasificación especializada: detectar la intención de tickets de soporte o etiquetar documentos legales o médicos con vocabulario muy específico.
- Formato estricto de salida: generar JSON, código o informes con una estructura fija y fiable.
- Idiomas o jergas poco representados: mejorar el rendimiento en un dominio técnico o un dialecto donde el modelo base falla.
El fine-tuning no es la solución cuando el problema es de conocimiento desactualizado o cambiante: para eso es mejor RAG. Tampoco arregla datos de mala calidad: un dataset con errores o sesgos los amplifica. Y como el conocimiento queda fijado en los pesos, actualizarlo obliga a reentrenar, mientras que con RAG basta con reindexar.
Cuándo usar fine-tuning (y cuándo no)
Usa fine-tuning cuando necesites que el modelo adopte un estilo, formato o comportamiento estable y repetitivo, o cuando el prompt se vuelve demasiado largo y costoso de repetir. Usa RAG cuando necesites conocimiento actualizado y verificable con citas a la fuente. Y empieza siempre por prompt engineering: muchas veces un buen prompt resuelve el problema sin coste de entrenamiento.
Conceptos relacionados
Para dominar el fine-tuning conviene entender antes qué es un LLM, en qué se diferencia de RAG, cómo encaja dentro del machine learning y el deep learning, y por qué el prompt engineering suele ser el primer paso antes de ajustar un modelo.
Preguntas frecuentes sobre fine-tuning
¿Fine-tuning o RAG? Depende del problema. Fine-tuning para estilo, formato y tareas repetitivas; RAG para conocimiento actualizado y trazable. A menudo se combinan.
¿Cuántos datos necesito para hacer fine-tuning? Menos de lo que parece: con técnicas como LoRA, unos cientos o pocos miles de ejemplos de alta calidad suelen bastar para tareas concretas. La calidad pesa más que el volumen.
¿Es caro hacer fine-tuning? Con LoRA y QLoRA se ha abaratado mucho: se pueden ajustar modelos grandes en una sola GPU. El fine-tuning completo de modelos enormes sí sigue siendo costoso.
¿El fine-tuning puede empeorar el modelo? Sí. Un dataset pequeño o sesgado puede provocar sobreajuste u "olvido catastrófico" de capacidades generales. Por eso es clave evaluar siempre contra un conjunto de validación antes de desplegar.