Lección 4 de 13

Input multimodal y screenshots

Codex CLI soporta input multimodal: puedes enviarle screenshots de bugs, disenos de UI o diagramas y el agente los interpreta para generar o modificar codigo.

Usar screenshots como input

code
Screenshots de errores

En vez de copiar y pegar errores del navegador, toma un screenshot. Codex puede leer el error de la imagen y entender el contexto visual (que pagina, que componente) mejor que solo el texto del error.

Puntos clave

  • Soporta screenshots, disenos y diagramas como input
  • Usa la capacidad de vision de o3/o4-mini
  • Ideal para bugs visuales y implementacion de disenos
  • Comando: codex "prompt" --image ./archivo.png

Quiz Generado por IA

Evalua tu comprension de esta leccion con preguntas personalizadas.