Datos de entrenamiento

Subconjunto de datos que el modelo usa para aprender ajustando sus parámetros. Es de donde el modelo extrae todo su conocimiento, por lo que sus sesgos y vacíos se reflejan en el resultado.

Subconjunto de datos que el modelo usa para aprender ajustando sus parámetros. Es de donde el modelo extrae todo su conocimiento, por lo que sus sesgos y vacíos se reflejan en el resultado.

Actualizado: 3 de junio de 2026.

Lo que un modelo "sabe" proviene directamente de sus datos de entrenamiento. Si el dataset no contiene cierta información o la representa de forma sesgada, el modelo heredará esas limitaciones.

Corte de conocimiento

Los LLM tienen una fecha de corte: no conocen nada posterior a sus datos de entrenamiento. Por eso se complementan con RAG para información actualizada.

Riesgo de sesgo

Datos históricos sesgados producen sesgo algorítmico. Curar y equilibrar los datos es parte esencial de una IA responsable.