Temperatura (en modelos de lenguaje)

Parámetro que regula cuánta aleatoriedad introduce un modelo al generar texto. Una temperatura baja produce respuestas más predecibles y deterministas; una alta, más variadas y creativas.

Parámetro que regula cuánta aleatoriedad introduce un modelo al generar texto. Una temperatura baja produce respuestas más predecibles y deterministas; una alta, más variadas y creativas.

Actualizado: 3 de junio de 2026.

Al generar cada token, el modelo calcula probabilidades para muchas opciones. La temperatura escala esas probabilidades antes de elegir: cerca de 0 casi siempre toma la opción más probable; valores como 0,8-1 dan más espacio a alternativas.

Cuándo usar cada valor

  • Baja (0-0,3): tareas exactas, código, extracción de datos, respuestas factuales.
  • Media (0,5-0,8): redacción general, asistentes conversacionales.
  • Alta (0,9-1,2): brainstorming, escritura creativa, generación de ideas.

Relación con top-p

La temperatura y top-p controlan la aleatoriedad por vías distintas. Suele recomendarse ajustar solo uno de los dos para no descontrolar la salida.

Hablar por WhatsApp
Falar no WhatsApp