Lección 13 de 16

Leccion 13: ChatGPT para analisis de datos

0:00 / 0:00

Leccion 13: ChatGPT para analisis de datos

Análisis de datos ChatGPT
Advanced Data Analysis: el analista de datos que siempre está disponible

Advanced Data Analysis (antes llamado Code Interpreter) es una de las funcionalidades más poderosas y menos exploradas de ChatGPT Plus. Permite subir datasets reales, y ChatGPT ejecuta código Python en tiempo real para analizarlos, generar visualizaciones, y extraer insights.

No necesitás saber Python. ChatGPT escribe y ejecuta el código por vos. Lo que sí necesitás es saber qué preguntas hacer.

Cómo activar Advanced Data Analysis

  1. Disponible con ChatGPT Plus o superior
  2. En la conversación, haz clic en el clip/botón de adjuntar
  3. Sube tu archivo: CSV, Excel (.xlsx), JSON, PDF con tablas, o código Python
  4. Una vez que hay un archivo adjunto, ChatGPT activa automáticamente el intérprete de código
  5. También puedes activarlo manualmente con el botón de herramientas → Code Interpreter

Flujo de análisis: del archivo bruto a los insights

Paso 1: Exploración inicial (siempre primero)

He subido un CSV con datos de ventas. Por favor:
1. Muéstrame las primeras 5 filas
2. Describe cada columna (tipo de dato, valores únicos, rango)
3. Identifica valores nulos o inconsistencias obvias
4. Dime el período de tiempo cubierto y número de registros
5. Dame un resumen estadístico de las columnas numéricas

Paso 2: Limpieza de datos

Basado en la exploración, limpia el dataset:
1. Maneja los valores nulos en [columnas con nulos] usando [estrategia]
2. Normaliza los formatos de [columna de fechas]
3. Elimina duplicados si los hay
4. Convierte [columna de texto con números] a tipo numérico
5. Muéstrame cuántos registros se modificaron/eliminaron y por qué

Paso 3: Análisis exploratorio

Realiza un análisis exploratorio completo:
1. Distribución de ventas por [dimensión principal]
2. Evolución temporal (gráfico de línea)
3. Top 10 [productos/clientes/regiones] por [métrica]
4. Correlación entre [variable A] y [variable B]
5. Identifica outliers y su posible explicación

Prompts para análisis específicos por tipo de negocio

E-commerce: Análisis de ventas

Con este dataset de ventas de e-commerce, analiza:
1. Revenue total y ticket promedio por mes
2. Tasa de conversión (si hay datos de visitas)
3. Top 10 productos por revenue y por unidades
4. Análisis de cohortes: retención de clientes por mes de adquisición
5. Distribución geográfica de ventas
6. Patrón estacional (qué días/meses venden más)
Crea visualizaciones para cada análisis y un dashboard resumen.

SaaS: Métricas de negocio

Analiza estas métricas de SaaS:
1. MRR (Monthly Recurring Revenue) y crecimiento MoM
2. Churn rate mensual y anualizado
3. LTV (Customer Lifetime Value) por plan/segmento
4. CAC (Customer Acquisition Cost) por canal si hay datos
5. Net Revenue Retention (NRR)
6. Proyección de MRR para los próximos 6 meses basada en tendencia actual
Incluye benchmarks de SaaS para comparar si corresponde.

Recursos Humanos: Análisis de workforce

Analiza los datos de RRHH:
1. Headcount por departamento y evolución
2. Rotación por departamento y trimestre
3. Distribución salarial por nivel/área
4. Tiempo promedio para cubrir vacantes
5. Correlación entre antigüedad y performance (si hay datos)
6. Predictores de renuncia (análisis de factores)
Identifica dónde hay riesgos de retención y qué factores correlacionan con ellos.

Generación de visualizaciones profesionales

Para dashboards ejecutivos

Crea un dashboard ejecutivo con las 6 métricas más importantes de este negocio.
Requisitos de visualización:
- Estilo profesional (colores corporativos: primario #1E40AF, secundario #10B981)
- Cada gráfico debe tener título, eje X e Y etiquetados, y leyenda clara
- Incluir una caja de texto con el insight principal de cada gráfico
- Formato de exportación: PNG de alta resolución
Dashboard debe responder: ¿Cómo estamos vs el mes pasado? ¿Qué preocupa? ¿Qué celebrar?

Comparaciones period-over-period

Compara el desempeño de Q4 2025 vs Q4 2024:
1. Gráfico de barras agrupadas para las métricas clave
2. Tabla de variación absoluta y porcentual
3. Waterfall chart mostrando los factores de crecimiento/decrecimiento
4. Texto ejecutivo de 100 palabras explicando los principales cambios

Análisis predictivo básico

Forecasting de ventas

Con los datos históricos de ventas, crea un forecast para los próximos 3 meses:
1. Usa regresión lineal como baseline
2. Si hay estacionalidad clara, ajusta con un modelo de descomposición
3. Incluye intervalos de confianza (optimista/base/pesimista)
4. Gráfico de historico + forecast
5. Explica los supuestos del modelo y sus limitaciones

Segmentación de clientes con clustering

Segmenta a los clientes usando RFM analysis (Recency, Frequency, Monetary):
1. Calcula RFM score para cada cliente
2. Crea 4-5 segmentos significativos
3. Visualiza los segmentos en un scatter plot 3D o mapa de calor
4. Para cada segmento, describe: quiénes son, qué valor tienen, qué estrategia aplicar
5. Exporta la tabla de clientes con su segmento asignado

De datos a reporte ejecutivo

Basado en todos los análisis que hemos realizado, genera un reporte ejecutivo:
Formato:
1. Resumen ejecutivo (5 puntos clave en bullets, máximo 150 palabras)
2. Highlights positivos del período
3. Alertas y áreas de preocupación
4. Top 3 recomendaciones con mayor impacto potencial
5. Próximos pasos concretos con responsables y fechas
Tono: objetivo, orientado a la acción, basado en los datos analizados
Audiencia: directorio ejecutivo sin background técnico en datos

Limitaciones que debes conocer

LimitaciónImpactoWorkaround
Archivos máx ~50MBDatasets grandes no se pueden subir directamenteMuestrea el dataset o agrega previamente
Sesión temporalLos archivos no persisten entre conversacionesUsar Projects para tener los datos siempre disponibles
Sin acceso a internetNo puede buscar datos externosDescarga los datos tú mismo y súbelos
Modelos ML básicosNo es un reemplazo de herramientas ML profesionalesPara ML avanzado, usar Python/scikit-learn directamente
Ejercicio práctico: Análisis de tu propio negocio

Opción A (con datos reales):

  1. Exporta un reporte de ventas, visitas web, o cualquier métrica de tu negocio/trabajo
  2. Sube el CSV a ChatGPT con Advanced Data Analysis
  3. Sigue el flujo: exploración → limpieza → análisis → visualización → reporte

Opción B (con datos de práctica):

  1. Descarga un dataset público de Kaggle (ej: ventas de Superstore, datos de Airbnb)
  2. Realiza el análisis completo siguiendo los prompts de la lección
  3. Genera un reporte ejecutivo y una visualización dashboard
Pon a prueba tu conocimiento
¿Cuál es la limitación más importante a tener en cuenta al usar Advanced Data Analysis con datos sensibles de clientes?
  • No puede manejar más de 1,000 filas de datos
  • Los archivos subidos se procesan en los servidores de OpenAI, por lo que datos muy sensibles (PII, datos médicos, datos financieros regulados) deben anonimizarse antes de subir o usar una solución enterprise
  • No genera visualizaciones de calidad profesional
  • Solo funciona con archivos Excel, no CSV
Correcto: Los datos subidos a ChatGPT se procesan en servidores de OpenAI. Para datos sensibles (PII, HIPAA, PCI), se debe anonimizar/pseudonimizar antes de subir, usar la versión Enterprise de ChatGPT (con contratos de datos más fuertes), o procesar localmente.

Quiz Generado por IA

Evalua tu comprension de esta leccion con preguntas personalizadas.