Aumento de datos (data augmentation)

Técnica que crea variantes de los datos existentes —rotando, recortando o parafraseando— para ampliar y diversificar el conjunto de entrenamiento sin recolectar datos nuevos.

Técnica que crea variantes de los datos existentes —rotando, recortando o parafraseando— para ampliar y diversificar el conjunto de entrenamiento sin recolectar datos nuevos.

Actualizado: 3 de junio de 2026.

El aumento de datos genera ejemplos adicionales a partir de los reales: voltear o iluminar imágenes, reformular frases, añadir ruido. El modelo ve más variedad y generaliza mejor.

Beneficios

Reduce el sobreajuste y mejora el rendimiento cuando los datos escasean, sin el coste de recolectar y etiquetar más.

Relación con los datos sintéticos

Es pariente de los datos sintéticos, aunque aquí se parte de datos reales y se transforman, en lugar de generarlos desde cero.