Aumento de datos (data augmentation)
Técnica que crea variantes de los datos existentes —rotando, recortando o parafraseando— para ampliar y diversificar el conjunto de entrenamiento sin recolectar datos nuevos.
Técnica que crea variantes de los datos existentes —rotando, recortando o parafraseando— para ampliar y diversificar el conjunto de entrenamiento sin recolectar datos nuevos.
Actualizado: 3 de junio de 2026.
El aumento de datos genera ejemplos adicionales a partir de los reales: voltear o iluminar imágenes, reformular frases, añadir ruido. El modelo ve más variedad y generaliza mejor.
Beneficios
Reduce el sobreajuste y mejora el rendimiento cuando los datos escasean, sin el coste de recolectar y etiquetar más.
Relación con los datos sintéticos
Es pariente de los datos sintéticos, aunque aquí se parte de datos reales y se transforman, en lugar de generarlos desde cero.