Lección 2 de 16

Leccion 2: La evolucion de GPT-4 a GPT-5

0:00 / 0:00

Leccion 2: La evolucion de GPT-4 a GPT-5

GPT model evolution
De GPT-4 a la era del razonamiento: entendiendo los modelos actuales

Una de las confusiones más comunes entre usuarios de ChatGPT es no saber cuándo usar qué modelo. Esta lección te va a dar un framework claro y práctico para tomar esa decisión de forma automática.

GPT-4o: El modelo todo-terreno

GPT-4o (la "o" es de "omni") es el modelo lanzado en mayo de 2024 que se convirtió en el estándar. Es rápido, multimodal (texto, imágenes, audio), y excepcionalmente bueno para la mayoría de tareas cotidianas.

Características técnicas de GPT-4o

  • Velocidad: ~2x más rápido que GPT-4 Turbo
  • Contexto: 128,000 tokens (aproximadamente 300 páginas de texto)
  • Multimodalidad: Texto, imágenes, audio de forma nativa
  • Precio en API: $2.50/millón tokens input, $10/millón tokens output
  • Benchmark MMLU: 88.7% (nivel humano en múltiples dominios)

Cuándo usar GPT-4o

  • Redacción, edición y generación de contenido
  • Análisis de documentos e imágenes
  • Programación de complejidad media
  • Brainstorming y creatividad
  • Traducciones y trabajo con idiomas
  • Respuestas que necesitan ser rápidas
  • Conversaciones largas con contexto extendido

GPT-4o mini: Cuando la velocidad y el costo son prioridad

GPT-4o mini (lanzado en julio 2024) es la versión más eficiente del modelo. Es sorprendentemente capaz para su precio y se ha convertido en la opción preferida para muchas aplicaciones de producción.

Cuándo usar GPT-4o mini

  • Tareas de clasificación y categorización masiva
  • Resúmenes rápidos
  • Extracción de datos estructurados
  • Respuestas cortas y directas
  • Aplicaciones con alto volumen de requests
  • Cuando el presupuesto de API es limitado

o1 y o3-mini: La revolución del razonamiento extendido

Aquí es donde se pone interesante. Los modelos de la serie "o" representan un cambio de paradigma en cómo los LLMs resuelven problemas difíciles.

¿Cómo funciona el razonamiento extendido?

Antes de darte una respuesta, o1 y o3 ejecutan una cadena de pensamiento interna (chain of thought) donde el modelo se habla a sí mismo para razonar el problema. Tú no ves ese proceso, pero el modelo puede dedicar segundos o incluso minutos a "pensar" antes de responder.

Analogía práctica: es la diferencia entre calcular 7x8 en tu cabeza (GPT-4o) versus resolver un problema de cálculo integral en papel (o1). Para 7x8 no necesitas papel; para la integral sí.

Benchmarks que importan

BenchmarkGPT-4oo1o3-mini (high)
AIME 2024 (Matemáticas olímpicas)13.4%83.3%96.7%
PhD Science Questions (GPQA)53.6%78.3%79.7%
Codeforces (programación competitiva)11%89%88.2%
HumanEval (código general)90.2%92.4%93.7%

Cuándo usar o1

  • Problemas matemáticos complejos (cálculo, estadística avanzada)
  • Debugging de código complejo con múltiples dependencias
  • Análisis de argumentos lógicos o filosóficos
  • Problemas científicos que requieren razonamiento multi-paso
  • Evaluación de estrategias de negocio con muchas variables
  • Cualquier tarea donde "pensar bien" importa más que "pensar rápido"

Cuándo usar o3-mini

  • Similar a o1 pero con mejor relación costo-beneficio
  • Tiene 3 modos: low (rápido), medium (balanceado), high (máximo razonamiento)
  • Ideal para STEM, programación y lógica formal
  • Disponible en el plan Plus (o1 completo requiere Plus también)

Tabla de decisión: ¿Qué modelo uso?

Tipo de tareaModelo recomendadoRazón
Email / documentoGPT-4oRápido, calidad suficiente
Código simple a medioGPT-4oMuy capaz y veloz
Código complejo / bug difícilo1 o o3-miniRazonamiento profundo
Matemáticas y estadísticao1 / o3-mini highAlta precisión
Análisis de imágenesGPT-4oÚnica opción multimodal
Brainstorming creativoGPT-4oMás fluido y diverso
Análisis estratégicoo1Considera más variables
Volumen alto / APIGPT-4o miniBajo costo
Voice ModeGPT-4oÚnica opción con voz

El mito de "el modelo más nuevo es siempre mejor"

Un error común es pensar que hay que usar siempre el modelo más avanzado. Esto es ineficiente y a veces contraproducente:

  • o1 es más lento que GPT-4o para tareas simples (pierde tiempo "pensando" en algo obvio)
  • o3-mini puede ser demasiado literal para tareas creativas
  • GPT-4o mini es perfectamente adecuado para el 70% de casos de uso

El profesional experto elige el modelo como elige una herramienta: el bisturí adecuado para la operación adecuada.

Novedades de 2025-2026: o3 y más allá

OpenAI lanzó o3 (la versión completa, no mini) a finales de 2025 como el modelo más capaz del mundo en razonamiento. Con un costo 15x mayor que o1, está diseñado para problemas donde la precisión es crítica: investigación científica, auditoría de código de misión crítica, análisis financiero complejo.

Para el usuario promedio de este curso, o3-mini con configuración "high" ofrece el 90% del beneficio de o3 completo a una fracción del costo.

Cómo cambiar entre modelos en la interfaz

En chat.openai.com

  1. Haz clic en el nombre del modelo actual (arriba del campo de texto o en la barra superior)
  2. Se abre un menú desplegable con todos los modelos disponibles según tu plan
  3. Selecciona el modelo deseado - el cambio es inmediato
  4. El modelo seleccionado se usa para los mensajes siguientes en esa conversación

Tip importante: Cambiar el modelo a mitad de una conversación es perfectamente válido. Si empezaste un análisis con GPT-4o y quieres refinar una sección difícil con o1, puedes cambiar en cualquier momento.

En la app móvil

  1. Inicia o abre una conversación
  2. Toca el nombre del modelo en la barra superior
  3. Selecciona de la lista

Nota sobre límites de uso

Con el plan Plus, los modelos más avanzados (o1, o3-mini) tienen límites de mensajes por período. Si los agotás, ChatGPT automáticamente cae al siguiente modelo disponible. Con el plan Pro ($200/mes), los límites son prácticamente inexistentes para uso personal.

Ejercicio práctico: El test de modelos

Vamos a demostrar la diferencia entre modelos con un ejercicio práctico:

Parte A - Tarea creativa (usa GPT-4o):

Escribe un párrafo de apertura para un blog post sobre 
"5 estrategias de productividad para emprendedores latinoamericanos".
El tono debe ser cercano, motivador, y específico para la realidad regional.

Parte B - Razonamiento lógico (usa o1 o o3-mini si tienes Plus):

Tengo un negocio que vende $50,000 ARS mensuales con el siguiente desglose:
- 60% va a costos variables
- 15% va a costos fijos
- Mi objetivo es llegar a $80,000 ARS con el mismo porcentaje de ganancia neta
¿Cuánto debo aumentar ingresos, o cuánto reducir costos variables, 
o alguna combinación de ambos? Muéstrame el razonamiento paso a paso.

Noten la diferencia en cómo cada modelo aborda su tipo de tarea nativa.

Pon a prueba tu conocimiento
Tienes que debuggear un error complejo en un sistema de base de datos con múltiples joins y procedimientos almacenados. ¿Qué modelo eliges?
  • GPT-4o mini, porque es más rápido
  • GPT-4o, porque tiene mejor contexto
  • o1 o o3-mini, porque el razonamiento extendido ayuda con problemas multi-paso
  • Todos son iguales para este caso
Correcto: o1 u o3-mini son ideales para debugging complejo porque su razonamiento extendido puede trazar todas las posibles causas y descartarlas sistemáticamente, algo que GPT-4o puede hacer pero de forma menos exhaustiva.

Quiz Generado por IA

Evalua tu comprension de esta leccion con preguntas personalizadas.