Lección 13 de 16
Leccion 13: ChatGPT para analisis de datos
0:00 / 0:00
Leccion 13: ChatGPT para analisis de datos
Advanced Data Analysis: el analista de datos que siempre está disponible
Advanced Data Analysis (antes llamado Code Interpreter) es una de las funcionalidades más poderosas y menos exploradas de ChatGPT Plus. Permite subir datasets reales, y ChatGPT ejecuta código Python en tiempo real para analizarlos, generar visualizaciones, y extraer insights.
No necesitás saber Python. ChatGPT escribe y ejecuta el código por vos. Lo que sí necesitás es saber qué preguntas hacer.
Cómo activar Advanced Data Analysis
- Disponible con ChatGPT Plus o superior
- En la conversación, haz clic en el clip/botón de adjuntar
- Sube tu archivo: CSV, Excel (.xlsx), JSON, PDF con tablas, o código Python
- Una vez que hay un archivo adjunto, ChatGPT activa automáticamente el intérprete de código
- También puedes activarlo manualmente con el botón de herramientas → Code Interpreter
Flujo de análisis: del archivo bruto a los insights
Paso 1: Exploración inicial (siempre primero)
He subido un CSV con datos de ventas. Por favor: 1. Muéstrame las primeras 5 filas 2. Describe cada columna (tipo de dato, valores únicos, rango) 3. Identifica valores nulos o inconsistencias obvias 4. Dime el período de tiempo cubierto y número de registros 5. Dame un resumen estadístico de las columnas numéricas
Paso 2: Limpieza de datos
Basado en la exploración, limpia el dataset: 1. Maneja los valores nulos en [columnas con nulos] usando [estrategia] 2. Normaliza los formatos de [columna de fechas] 3. Elimina duplicados si los hay 4. Convierte [columna de texto con números] a tipo numérico 5. Muéstrame cuántos registros se modificaron/eliminaron y por qué
Paso 3: Análisis exploratorio
Realiza un análisis exploratorio completo: 1. Distribución de ventas por [dimensión principal] 2. Evolución temporal (gráfico de línea) 3. Top 10 [productos/clientes/regiones] por [métrica] 4. Correlación entre [variable A] y [variable B] 5. Identifica outliers y su posible explicación
Prompts para análisis específicos por tipo de negocio
E-commerce: Análisis de ventas
Con este dataset de ventas de e-commerce, analiza: 1. Revenue total y ticket promedio por mes 2. Tasa de conversión (si hay datos de visitas) 3. Top 10 productos por revenue y por unidades 4. Análisis de cohortes: retención de clientes por mes de adquisición 5. Distribución geográfica de ventas 6. Patrón estacional (qué días/meses venden más) Crea visualizaciones para cada análisis y un dashboard resumen.
SaaS: Métricas de negocio
Analiza estas métricas de SaaS: 1. MRR (Monthly Recurring Revenue) y crecimiento MoM 2. Churn rate mensual y anualizado 3. LTV (Customer Lifetime Value) por plan/segmento 4. CAC (Customer Acquisition Cost) por canal si hay datos 5. Net Revenue Retention (NRR) 6. Proyección de MRR para los próximos 6 meses basada en tendencia actual Incluye benchmarks de SaaS para comparar si corresponde.
Recursos Humanos: Análisis de workforce
Analiza los datos de RRHH: 1. Headcount por departamento y evolución 2. Rotación por departamento y trimestre 3. Distribución salarial por nivel/área 4. Tiempo promedio para cubrir vacantes 5. Correlación entre antigüedad y performance (si hay datos) 6. Predictores de renuncia (análisis de factores) Identifica dónde hay riesgos de retención y qué factores correlacionan con ellos.
Generación de visualizaciones profesionales
Para dashboards ejecutivos
Crea un dashboard ejecutivo con las 6 métricas más importantes de este negocio. Requisitos de visualización: - Estilo profesional (colores corporativos: primario #1E40AF, secundario #10B981) - Cada gráfico debe tener título, eje X e Y etiquetados, y leyenda clara - Incluir una caja de texto con el insight principal de cada gráfico - Formato de exportación: PNG de alta resolución Dashboard debe responder: ¿Cómo estamos vs el mes pasado? ¿Qué preocupa? ¿Qué celebrar?
Comparaciones period-over-period
Compara el desempeño de Q4 2025 vs Q4 2024: 1. Gráfico de barras agrupadas para las métricas clave 2. Tabla de variación absoluta y porcentual 3. Waterfall chart mostrando los factores de crecimiento/decrecimiento 4. Texto ejecutivo de 100 palabras explicando los principales cambios
Análisis predictivo básico
Forecasting de ventas
Con los datos históricos de ventas, crea un forecast para los próximos 3 meses: 1. Usa regresión lineal como baseline 2. Si hay estacionalidad clara, ajusta con un modelo de descomposición 3. Incluye intervalos de confianza (optimista/base/pesimista) 4. Gráfico de historico + forecast 5. Explica los supuestos del modelo y sus limitaciones
Segmentación de clientes con clustering
Segmenta a los clientes usando RFM analysis (Recency, Frequency, Monetary): 1. Calcula RFM score para cada cliente 2. Crea 4-5 segmentos significativos 3. Visualiza los segmentos en un scatter plot 3D o mapa de calor 4. Para cada segmento, describe: quiénes son, qué valor tienen, qué estrategia aplicar 5. Exporta la tabla de clientes con su segmento asignado
De datos a reporte ejecutivo
Basado en todos los análisis que hemos realizado, genera un reporte ejecutivo: Formato: 1. Resumen ejecutivo (5 puntos clave en bullets, máximo 150 palabras) 2. Highlights positivos del período 3. Alertas y áreas de preocupación 4. Top 3 recomendaciones con mayor impacto potencial 5. Próximos pasos concretos con responsables y fechas Tono: objetivo, orientado a la acción, basado en los datos analizados Audiencia: directorio ejecutivo sin background técnico en datos
Limitaciones que debes conocer
| Limitación | Impacto | Workaround |
|---|---|---|
| Archivos máx ~50MB | Datasets grandes no se pueden subir directamente | Muestrea el dataset o agrega previamente |
| Sesión temporal | Los archivos no persisten entre conversaciones | Usar Projects para tener los datos siempre disponibles |
| Sin acceso a internet | No puede buscar datos externos | Descarga los datos tú mismo y súbelos |
| Modelos ML básicos | No es un reemplazo de herramientas ML profesionales | Para ML avanzado, usar Python/scikit-learn directamente |
Ejercicio práctico: Análisis de tu propio negocio
Opción A (con datos reales):
- Exporta un reporte de ventas, visitas web, o cualquier métrica de tu negocio/trabajo
- Sube el CSV a ChatGPT con Advanced Data Analysis
- Sigue el flujo: exploración → limpieza → análisis → visualización → reporte
Opción B (con datos de práctica):
- Descarga un dataset público de Kaggle (ej: ventas de Superstore, datos de Airbnb)
- Realiza el análisis completo siguiendo los prompts de la lección
- Genera un reporte ejecutivo y una visualización dashboard
Pon a prueba tu conocimiento
¿Cuál es la limitación más importante a tener en cuenta al usar Advanced Data Analysis con datos sensibles de clientes?
- No puede manejar más de 1,000 filas de datos
- Los archivos subidos se procesan en los servidores de OpenAI, por lo que datos muy sensibles (PII, datos médicos, datos financieros regulados) deben anonimizarse antes de subir o usar una solución enterprise
- No genera visualizaciones de calidad profesional
- Solo funciona con archivos Excel, no CSV
Correcto: Los datos subidos a ChatGPT se procesan en servidores de OpenAI. Para datos sensibles (PII, HIPAA, PCI), se debe anonimizar/pseudonimizar antes de subir, usar la versión Enterprise de ChatGPT (con contratos de datos más fuertes), o procesar localmente.
Quiz Generado por IA
Evalua tu comprension de esta leccion con preguntas personalizadas.