Barreras de seguridad (guardrails)

Reglas y filtros que limitan lo que un sistema de IA puede decir o hacer, para evitar respuestas peligrosas, fuera de tema o acciones no autorizadas. Son esenciales en agentes que ejecutan acciones reales.

Actualizado: 3 de junio de 2026.

Los guardrails actúan como límites de seguridad: validan entradas y salidas, bloquean contenido prohibido, restringen herramientas y exigen confirmación para acciones sensibles.

Por qué son críticos

Un agente autónomo sin barreras puede ejecutar acciones costosas o caer en una inyección de prompts. Los guardrails reducen ese riesgo.

Capas habituales

Filtros de contenido, validación de argumentos de herramientas, límites de presupuesto y humano en el bucle para decisiones críticas.