Datos sintéticos
Datos generados artificialmente por algoritmos o modelos de IA en lugar de recogidos del mundo real. Sirven para entrenar modelos cuando los datos reales escasean, son caros o sensibles.
Datos generados artificialmente por algoritmos o modelos de IA en lugar de recogidos del mundo real. Sirven para entrenar modelos cuando los datos reales escasean, son caros o sensibles.
Actualizado: 3 de junio de 2026.
Los datos sintéticos imitan las propiedades de los reales sin exponer información personal. Permiten entrenar y probar modelos en escenarios difíciles de recolectar (fraudes raros, fallos poco frecuentes).
Ventajas
Privacidad (no son datos reales de personas), escala y la posibilidad de cubrir casos extremos. Reducen la dependencia del etiquetado manual.
Cuidado
Si los datos sintéticos no reflejan bien la realidad, el modelo aprende un mundo distorsionado. Conviene validarlos contra datos reales.