GPU (Unidad de procesamiento gráfico)

Chip diseñado para realizar miles de operaciones matemáticas en paralelo. Aunque nació para gráficos, es el caballo de batalla del entrenamiento y la inferencia de modelos de IA modernos.

Chip diseñado para realizar miles de operaciones matemáticas en paralelo. Aunque nació para gráficos, es el caballo de batalla del entrenamiento y la inferencia de modelos de IA modernos.

Actualizado: 3 de junio de 2026.

Las redes neuronales se basan en multiplicaciones de matrices, una operación que las GPU ejecutan en paralelo mucho más rápido que una CPU. Por eso el auge del deep learning coincidió con la disponibilidad de GPU potentes.

Entrenamiento e inferencia

Entrenar un LLM grande requiere miles de GPU durante semanas. La inferencia también las usa, aunque técnicas como la cuantización permiten reducir el hardware necesario.

Alternativas

Google desarrolló las TPU, chips a medida para IA. Otras empresas crean aceleradores propios para abaratar el coste por consulta.