Glosario de IA
Definiciones claras de los términos más importantes de inteligencia artificial en español. Aprende el vocabulario que necesitas para avanzar con confianza.
3D generativo
Generación de modelos u objetos tridimensionales mediante IA, a partir de texto o imágenes. Acelera la creación de activos para videojuegos, diseño y realidad virtual.
Agente autónomo
Sistema de IA que persigue un objetivo planificando y ejecutando varios pasos por sí mismo, usando herramientas e iterando sin intervención humana en cada paso. Va más allá de responder: actúa.
Agente de IA
Un agente de IA es un sistema de inteligencia artificial que percibe su entorno, razona sobre un objetivo y ejecuta acciones de forma autónoma usando herramientas externas para lograrlo sin supervisión paso a paso.
Agrupamiento (clustering)
Técnica de aprendizaje no supervisado que agrupa datos en conjuntos según su similitud, sin etiquetas previas. Útil para segmentar clientes, organizar documentos o detectar patrones ocultos.
Alineamiento (de IA)
Conjunto de técnicas y objetivos para que un sistema de IA actúe conforme a los valores, intenciones y normas de las personas. Busca que el modelo sea útil, honesto y seguro.
Alucinación de IA
Una alucinación de IA ocurre cuando un modelo generativo produce información falsa, inventada o no respaldada por sus datos, pero la presenta con total seguridad como si fuera cierta.
API de IA
Interfaz de programación que permite a una aplicación enviar peticiones a un modelo de IA y recibir respuestas, sin alojar el modelo. Es la vía habitual para integrar modelos cerrados.
Aprendizaje con pocos ejemplos (few-shot)
Técnica en la que se incluyen unos pocos ejemplos de la tarea dentro del prompt para guiar al modelo, sin reentrenarlo. Mejora la precisión mostrando el patrón esperado.
Aprendizaje en contexto
Habilidad de los modelos de lenguaje para 'aprender' una tarea a partir de la información y los ejemplos incluidos en el prompt, sin modificar sus parámetros. Ocurre solo durante esa conversación.
Aprendizaje no supervisado
Forma de machine learning en la que el modelo descubre estructura en datos sin etiquetar. En lugar de aprender respuestas conocidas, encuentra patrones, grupos o relaciones ocultas por sí mismo.
Aprendizaje por refuerzo
Paradigma en el que un agente aprende a tomar decisiones por ensayo y error, recibiendo recompensas o penalizaciones según sus acciones. Busca la estrategia que maximiza la recompensa acumulada.
Aprendizaje sin ejemplos (zero-shot)
Capacidad de un modelo para realizar una tarea solo con la instrucción, sin ejemplos previos en el prompt. Demuestra lo que el modelo ya sabe de su entrenamiento.
Aprendizaje supervisado
Forma de machine learning en la que el modelo aprende de datos etiquetados: cada ejemplo incluye la respuesta correcta. El objetivo es que el modelo prediga esa respuesta en datos nuevos.
Asistente virtual
Programa de IA que interactúa con las personas en lenguaje natural para ayudarlas a realizar tareas, responder preguntas o controlar dispositivos. Abarca desde altavoces inteligentes hasta asistentes empresariales.
Aumento de datos (data augmentation)
Técnica que crea variantes de los datos existentes —rotando, recortando o parafraseando— para ampliar y diversificar el conjunto de entrenamiento sin recolectar datos nuevos.
Autocodificador (autoencoder)
Red neuronal que aprende a comprimir datos en una representación compacta y luego reconstruirlos. Útil para reducir dimensionalidad, detectar anomalías y generar datos.
Automatización inteligente
Combinación de IA con automatización de procesos para ejecutar tareas que antes requerían criterio humano. Va más allá de las reglas fijas al incorporar comprensión de lenguaje y decisiones.
Avatar de IA
Representación digital animada de una persona o personaje, generada por IA, que puede hablar y gesticular de forma realista. Se usa en vídeos, atención al cliente y creación de contenido.
Barreras de seguridad (guardrails)
Reglas y filtros que limitan lo que un sistema de IA puede decir o hacer, para evitar respuestas peligrosas, fuera de tema o acciones no autorizadas. Son esenciales en agentes que ejecutan acciones reales.
Base de datos vectorial
Base de datos especializada en almacenar y buscar embeddings por similitud. Es la pieza que permite recuperar, a gran escala y con rapidez, los fragmentos más relevantes en un sistema RAG.
Benchmark (de IA)
Prueba estandarizada que mide y compara el rendimiento de modelos en tareas concretas, como razonamiento, código o comprensión lectora. Permite comparar modelos de forma objetiva.
Búsqueda semántica
Forma de búsqueda que encuentra resultados por significado y no por coincidencia exacta de palabras. Usa embeddings para entender la intención, de modo que 'darme de baja' y 'cancelar suscripción' devuelven lo mismo.
Cadena de pensamiento (chain of thought)
Técnica de prompting que pide al modelo razonar paso a paso antes de responder. Hacer explícito el razonamiento mejora la precisión en problemas de lógica, matemáticas y planificación.
Capa oculta
Capa intermedia de una red neuronal, situada entre la entrada y la salida, donde ocurre el procesamiento que transforma los datos. Las redes profundas tienen muchas capas ocultas.
ChatGPT
Asistente conversacional de OpenAI lanzado a finales de 2022 que popularizó masivamente la IA generativa. Permite chatear, escribir, programar y analizar archivos a través de un modelo GPT.
Clasificación
Tarea de machine learning que consiste en asignar una entrada a una de varias categorías predefinidas. Detectar spam, diagnosticar una enfermedad o etiquetar el sentimiento de un texto son problemas de clasificación.
Claude
Familia de modelos de lenguaje desarrollada por Anthropic, conocida por su enfoque en seguridad, razonamiento y manejo de contextos largos. Se usa tanto vía chat como por API y en herramientas de programación.
Clonación de voz
Tecnología que reproduce la voz de una persona a partir de muestras de audio, permitiendo generar habla nueva con ese mismo timbre. Tiene usos creativos y de accesibilidad, pero también riesgos de suplantación.
Conjunto de datos (dataset)
Colección estructurada de ejemplos que se usa para entrenar, validar o evaluar un modelo. Su tamaño, calidad y representatividad determinan en gran medida el rendimiento del modelo.
ControlNet
Técnica que añade control preciso a la generación de imágenes guiándola con una referencia estructural, como bordes, una pose o un mapa de profundidad. Permite componer imágenes con mayor exactitud.
Copiloto de IA
Asistente de IA integrado en una herramienta de trabajo que sugiere acciones o contenido mientras la persona mantiene el control y decide. Aumenta la productividad sin sustituir al usuario.
Coste por token
Modelo de precios habitual de las APIs de IA, en el que se cobra según la cantidad de tokens procesados, tanto de entrada como de salida. Determina el coste operativo de una aplicación de IA.
Cuantización
Técnica que reduce la precisión numérica de los pesos de un modelo (por ejemplo de 16 a 4 bits) para que ocupe menos memoria y se ejecute más rápido, con una pérdida de calidad mínima.
DALL·E
Modelo de generación de imágenes a partir de texto desarrollado por OpenAI. Se integra en ChatGPT y permite crear ilustraciones describiéndolas en lenguaje natural.
Datos de entrenamiento
Subconjunto de datos que el modelo usa para aprender ajustando sus parámetros. Es de donde el modelo extrae todo su conocimiento, por lo que sus sesgos y vacíos se reflejan en el resultado.
Datos sintéticos
Datos generados artificialmente por algoritmos o modelos de IA en lugar de recogidos del mundo real. Sirven para entrenar modelos cuando los datos reales escasean, son caros o sensibles.
Deep learning (Aprendizaje profundo)
Subcampo del machine learning que usa redes neuronales con muchas capas para aprender representaciones cada vez más abstractas de los datos. Es la tecnología detrás del reconocimiento de imágenes, la traducción automática y los modelos de lenguaje modernos.
Deepfake
Contenido audiovisual falso pero realista creado con IA, en el que se sustituye o sintetiza el rostro o la voz de una persona. Tiene usos creativos, pero también de fraude y desinformación.
DeepSeek
Empresa china de IA y su familia de modelos, varios de pesos abiertos, reconocidos por su fuerte rendimiento en razonamiento y código a un coste de entrenamiento comparativamente bajo.
Deriva del modelo (model drift)
Degradación del rendimiento de un modelo con el tiempo porque la realidad cambia y ya no se parece a sus datos de entrenamiento. Exige monitorización y reentrenamiento periódicos.
Descenso de gradiente
Algoritmo de optimización que ajusta los parámetros de un modelo en la dirección que más reduce el error. Es el motor que hace que las redes neuronales aprendan.
Destilación de modelos
Técnica para transferir el conocimiento de un modelo grande (maestro) a uno más pequeño (alumno), que aprende a imitar sus salidas. Permite obtener modelos ligeros y rápidos con buena parte de la calidad del original.
Dropout
Técnica de regularización que apaga aleatoriamente algunas neuronas durante el entrenamiento para evitar que la red dependa en exceso de unas pocas conexiones. Reduce el sobreajuste.
Embedding (Incrustación vectorial)
Un embedding es la representación de un texto, imagen u otro dato como un vector de números que captura su significado, de modo que los elementos con sentido parecido quedan cerca en el espacio vectorial.
Entrenamiento (de modelos)
Proceso por el que un modelo ajusta sus parámetros analizando datos para minimizar sus errores. Es la fase más costosa del ciclo de vida de un modelo de IA y determina lo que el modelo sabe.
Época (epoch)
Una pasada completa del modelo sobre todo el conjunto de datos de entrenamiento. El entrenamiento suele requerir varias épocas para que el modelo aprenda bien.
Etiquetado de datos
Proceso de asignar etiquetas o anotaciones a los datos para que un modelo supervisado pueda aprender de ellos. Suele ser manual, costoso y determinante para la calidad del modelo.
Explicabilidad (IA explicable, XAI)
Capacidad de entender y justificar por qué un modelo de IA tomó una decisión. Es clave para confiar en sistemas usados en ámbitos sensibles y para cumplir normativas.
Fine-tuning (Ajuste fino)
El fine-tuning es el proceso de tomar un modelo de IA ya preentrenado y reentrenarlo con un conjunto de datos propio para especializarlo en una tarea, un dominio o un estilo concretos, sin partir de cero.
Fragmentación (chunking)
Proceso de dividir documentos largos en fragmentos más pequeños antes de convertirlos en embeddings. Una buena estrategia de chunking es clave para que un sistema RAG recupere contexto preciso.
Función de activación
Función matemática que decide la salida de una neurona introduciendo no linealidad en la red. Sin ella, una red neuronal solo podría aprender relaciones lineales.
Función de pérdida
Fórmula que mide cuánto se equivoca un modelo comparando sus predicciones con las respuestas correctas. Entrenar consiste en minimizar esta función ajustando los parámetros.
Gemini
Familia de modelos multimodales de Google DeepMind capaz de procesar texto, imágenes, audio y vídeo. Se integra en los productos de Google y se ofrece por API.
GitHub Copilot
Asistente de programación basado en IA que sugiere código mientras escribes, integrado en el editor. Popularizó el concepto de copiloto aplicado al desarrollo de software.
GPT
Familia de modelos de lenguaje de OpenAI basados en la arquitectura transformer. Sus siglas significan 'Generative Pre-trained Transformer' y dieron nombre a productos como ChatGPT.
GPTs personalizados
Versiones a medida de ChatGPT que un usuario configura con instrucciones, conocimiento y herramientas propias, sin programar. Permiten crear asistentes especializados reutilizables.
GPU (Unidad de procesamiento gráfico)
Chip diseñado para realizar miles de operaciones matemáticas en paralelo. Aunque nació para gráficos, es el caballo de batalla del entrenamiento y la inferencia de modelos de IA modernos.
Grok
Familia de modelos de lenguaje desarrollada por xAI, integrada en la plataforma X. Ofrece chat y, en algunas versiones, acceso a información en tiempo real de la red social.
Herramienta (tool) en IA
Función o servicio externo que un modelo de IA puede invocar para hacer algo que no puede por sí mismo: buscar en la web, ejecutar código, consultar una base de datos o llamar a una API.
Hugging Face
Plataforma y comunidad de referencia para compartir modelos de IA, conjuntos de datos y aplicaciones. Funciona como un repositorio central del ecosistema de modelos abiertos.
Humano en el bucle (human-in-the-loop)
Patrón de diseño en el que una persona supervisa, aprueba o corrige las decisiones de un sistema de IA en puntos críticos. Equilibra automatización con control humano.
IA conversacional
Tecnología que permite a las máquinas mantener diálogos en lenguaje natural con las personas. Sustenta chatbots, asistentes virtuales y sistemas de atención al cliente automatizados.
IA discriminativa
Tipo de modelo que aprende a distinguir entre categorías o a predecir un valor a partir de una entrada, sin generar contenido nuevo. Clasificadores de spam, detección de fraude o diagnóstico por imagen son ejemplos.
IA en el borde (edge AI)
Ejecución de modelos de IA directamente en el dispositivo donde se generan los datos —móvil, cámara, sensor— en lugar de en la nube. Mejora la privacidad, la latencia y el funcionamiento sin conexión.
IA en la sombra (shadow AI)
Uso de herramientas de IA por parte de empleados sin la aprobación ni el control del departamento de tecnología o seguridad. Genera riesgos de fuga de datos y cumplimiento.
IA generativa
Tipo de inteligencia artificial capaz de crear contenido nuevo —texto, imágenes, audio, vídeo o código— en lugar de limitarse a clasificar o predecir. Es la categoría a la que pertenecen los LLM y los generadores de imágenes.
IA responsable
Enfoque de diseño y uso de la IA que prioriza la equidad, la transparencia, la privacidad y la rendición de cuentas. Busca que los sistemas sean beneficiosos y minimicen daños.
IA soberana
Estrategia de desarrollar y controlar capacidades de IA dentro de las fronteras y normas de un país u organización, reduciendo la dependencia de proveedores externos y protegiendo los datos.
Imagen a imagen
Técnica que transforma una imagen de entrada en otra según un prompt o estilo, en lugar de partir de cero. Sirve para cambiar de estilo, rellenar o reinterpretar una imagen existente.
Inferencia
Fase en la que un modelo ya entrenado se usa para generar predicciones o respuestas a partir de nuevas entradas. A diferencia del entrenamiento, la inferencia no modifica los pesos del modelo.
Ingeniería de características
Proceso de seleccionar, transformar y crear las variables de entrada que un modelo usará para aprender. En el machine learning clásico suele ser determinante para el rendimiento.
Inteligencia artificial general (AGI)
IA hipotética capaz de igualar al ser humano en cualquier tarea intelectual, no solo en dominios concretos. A diferencia de la IA actual, sería flexible y generalista.
Inyección de prompts
Ataque en el que un usuario o un contenido externo introduce instrucciones maliciosas para que el modelo ignore sus reglas o realice acciones no deseadas. Es uno de los riesgos de seguridad clave en aplicaciones con IA.
Jailbreak (de modelos de IA)
Técnica para eludir las restricciones de seguridad de un modelo y conseguir que genere contenido que normalmente rechazaría. Pone a prueba la robustez del alineamiento.
LangChain
Marco de desarrollo para construir aplicaciones con modelos de lenguaje, encadenando llamadas, herramientas, memoria y fuentes de datos. Facilita crear sistemas RAG y agentes.
Latencia de inferencia
Tiempo que tarda un modelo en devolver una respuesta tras recibir una entrada. Es un factor clave en la experiencia de usuario y en el coste de las aplicaciones de IA.
Llama
Familia de modelos de lenguaje de pesos abiertos creada por Meta. Al publicar sus pesos, permitió a empresas y desarrolladores ejecutar y adaptar LLM en su propia infraestructura.
Llamada a funciones (function calling)
Capacidad de un modelo de lenguaje para invocar herramientas o funciones externas de forma estructurada. El modelo decide cuándo llamar a una función y con qué argumentos, y usa el resultado para responder.
LLM (Large Language Model / Modelo de Lenguaje Grande)
Un LLM es un modelo de inteligencia artificial entrenado con enormes cantidades de texto que aprende a predecir la siguiente palabra y, gracias a ello, es capaz de comprender, generar y razonar sobre lenguaje natural.
LoRA (adaptación de bajo rango)
Método de fine-tuning eficiente que entrena solo un pequeño conjunto de parámetros adicionales en lugar de todo el modelo. Permite personalizar modelos grandes con poco cómputo.
Lote (batch)
Grupo de ejemplos que el modelo procesa a la vez antes de actualizar sus parámetros. El tamaño del lote influye en la velocidad, la memoria y la estabilidad del entrenamiento.
Machine learning (Aprendizaje automático)
Rama de la inteligencia artificial en la que un sistema aprende patrones a partir de datos en lugar de seguir reglas programadas a mano. Con suficientes ejemplos, el modelo generaliza y hace predicciones sobre datos nuevos.
Marca de agua de IA
Señal, visible o invisible, que se incrusta en contenido generado por IA para indicar su origen. Ayuda a distinguir lo sintético de lo real y a combatir la desinformación.
MCP (Model Context Protocol)
El Model Context Protocol (MCP) es un estándar abierto, creado por Anthropic, que define una forma única y universal de conectar modelos de IA con herramientas, datos y aplicaciones externas mediante un protocolo cliente-servidor.
Mecanismo de atención
Componente de los transformers que permite al modelo ponderar la importancia de cada token respecto a los demás al procesar una secuencia. Gracias a él, el modelo capta relaciones a larga distancia dentro del texto.
Memoria de agente
Mecanismo que permite a un agente o asistente de IA recordar información entre turnos o sesiones, más allá de la ventana de contexto inmediata. Da continuidad y personalización.
Mezcla de expertos (MoE)
Arquitectura en la que el modelo se divide en muchos subredes 'expertas' y un enrutador activa solo unas pocas por cada token. Permite modelos enormes que, en inferencia, usan solo una fracción de sus parámetros.
Midjourney
Servicio de generación de imágenes por IA conocido por su alta calidad estética y su estilo artístico. Se usa principalmente describiendo la imagen deseada mediante prompts.
Mistral
Empresa europea de IA y su familia de modelos de lenguaje, varios de ellos de pesos abiertos. Es conocida por modelos eficientes que ofrecen buena calidad con menor coste.
MLOps
Conjunto de prácticas para desplegar, monitorizar y mantener modelos de machine learning en producción de forma fiable. Aplica principios de DevOps al ciclo de vida de los modelos.
Modelo cerrado
Modelo cuyos pesos no se publican y que solo se usa a través de una API o un producto del proveedor. Suele ofrecer máxima calidad a cambio de menor control y dependencia externa.
Modelo de difusión
Tipo de modelo generativo que crea imágenes, audio o vídeo partiendo de ruido aleatorio y eliminándolo paso a paso hasta formar un resultado coherente. Es la base de la mayoría de generadores de imagen actuales.
Modelo de pesos abiertos
Modelo cuyos pesos se publican para que cualquiera pueda descargarlo, ejecutarlo y adaptarlo. Ofrece control, privacidad y previsibilidad de costes frente a los modelos accesibles solo por API.
Modelo fundacional
Modelo de gran tamaño preentrenado sobre enormes cantidades de datos que sirve de base para múltiples tareas, ya sea por adaptación o mediante prompts. GPT, Claude y Gemini son modelos fundacionales.
Modelo multimodal
Modelo capaz de procesar y combinar varios tipos de datos a la vez —texto, imagen, audio o vídeo— en una misma representación. Permite, por ejemplo, describir una foto o responder preguntas sobre un vídeo.
Música generativa
Creación de música original mediante IA, a partir de descripciones de texto, estilos o melodías de referencia. Permite generar pistas completas o acompañamientos en segundos.
OCR (reconocimiento óptico de caracteres)
Tecnología que extrae texto legible de imágenes o documentos escaneados. Convierte facturas, libros o fotos de texto en datos editables y buscables.
Ollama
Herramienta que facilita descargar y ejecutar modelos de lenguaje de pesos abiertos en tu propio ordenador con un solo comando. Hace accesible la IA local y privada.
Orquestación de agentes
Coordinación de varios pasos, herramientas o agentes de IA para completar un flujo de trabajo. Define el orden, las condiciones y el paso de información entre componentes.
Parámetros (de un modelo)
Valores numéricos internos que un modelo aprende durante el entrenamiento y que definen su comportamiento. El número de parámetros —miles de millones en los LLM grandes— es una medida aproximada de la capacidad del modelo.
Pesos (weights)
Los valores numéricos que controlan la fuerza de cada conexión en una red neuronal. Ajustar los pesos durante el entrenamiento es, literalmente, lo que hace que un modelo aprenda.
Preentrenamiento
Primera fase de entrenamiento de un modelo grande, en la que aprende patrones generales del lenguaje o del mundo a partir de corpus masivos, antes de cualquier especialización.
Procesamiento del lenguaje natural (PLN)
Disciplina de la IA centrada en que las máquinas entiendan, interpreten y generen lenguaje humano. Abarca desde la traducción y el análisis de sentimiento hasta los modelos de lenguaje generativos.
Prompt de sistema (system prompt)
Instrucción inicial y persistente que define el rol, el tono y las reglas de comportamiento de un modelo durante toda la conversación. Marca el marco dentro del cual responde el asistente.
Prompt Engineering
Disciplina de diseñar, estructurar y refinar las instrucciones (prompts) que se dan a un modelo de lenguaje para obtener respuestas más precisas, útiles y reproducibles.
Prompt negativo
Instrucción que indica al modelo de imagen qué elementos NO debe incluir en el resultado. Ayuda a evitar artefactos, estilos no deseados o contenido inapropiado.
RAG (Generación Aumentada por Recuperación)
Técnica que conecta un modelo de lenguaje con una fuente de conocimiento externa para que recupere información relevante antes de responder, en lugar de depender solo de lo que memorizó al entrenarse.
Razonamiento (modelos de razonamiento)
Capacidad de algunos modelos de IA para descomponer un problema en pasos intermedios antes de dar la respuesta final. Los modelos de razonamiento dedican más cómputo a 'pensar' y rinden mejor en matemáticas, lógica y código.
ReAct (razonar y actuar)
Patrón de diseño de agentes en el que el modelo alterna entre razonar sobre el problema y ejecutar acciones con herramientas, usando el resultado de cada acción para decidir el siguiente paso.
Reconocimiento de voz
Tecnología que convierte el habla en texto. Permite dictar, transcribir reuniones y dar órdenes por voz a asistentes y dispositivos.
Red generativa antagónica (GAN)
Arquitectura generativa con dos redes que compiten: una genera muestras falsas y otra intenta distinguirlas de las reales. Esa competencia produce resultados cada vez más realistas.
Red neuronal artificial
Modelo de cálculo inspirado en el cerebro, compuesto por unidades llamadas neuronas organizadas en capas que se conectan mediante pesos ajustables. Al entrenarse, esos pesos se afinan para transformar entradas en salidas útiles.
Red neuronal convolucional (CNN)
Tipo de red neuronal especializada en datos con estructura espacial, sobre todo imágenes. Detecta patrones locales como bordes y texturas mediante operaciones de convolución.
Red neuronal recurrente (RNN)
Red neuronal diseñada para datos secuenciales, como texto o series temporales, que mantiene un estado interno para recordar información de pasos anteriores. Fue clave antes de los transformers.
Reescalado (upscaling)
Aumento de la resolución de una imagen o vídeo mediante IA, añadiendo detalle plausible en lugar de simplemente estirar los píxeles. Mejora imágenes pequeñas o antiguas.
Regresión
Tarea de machine learning cuyo objetivo es predecir un valor numérico continuo a partir de los datos de entrada, como un precio, una temperatura o una demanda futura.
Reordenamiento (re-ranking)
Paso que reordena los resultados de una búsqueda inicial usando un modelo más preciso, para que los fragmentos más relevantes queden arriba. Mejora la calidad de la recuperación en sistemas RAG.
Repintado (inpainting)
Técnica que regenera o edita una región concreta de una imagen dejando el resto intacto. Permite eliminar objetos, corregir defectos o añadir elementos de forma coherente.
Retropropagación (backpropagation)
Algoritmo que calcula cómo ajustar cada peso de una red neuronal propagando el error desde la salida hacia atrás. Es el método central que hace posible entrenar redes profundas.
RLHF (Aprendizaje por refuerzo con retroalimentación humana)
Método para alinear un modelo de lenguaje con las preferencias de las personas: humanos puntúan respuestas, se entrena un modelo de recompensa con esas preferencias y se ajusta el LLM mediante aprendizaje por refuerzo.
Semilla (seed)
Número que inicializa la aleatoriedad de un modelo generativo. Usar la misma semilla y los mismos parámetros reproduce exactamente el mismo resultado, lo que permite control y comparación.
Sesgo algorítmico
Tendencia de un modelo a producir resultados injustos o discriminatorios, normalmente porque aprendió de datos sesgados. Puede afectar a decisiones sensibles como crédito, contratación o justicia.
Sistema multiagente
Arquitectura en la que varios agentes de IA colaboran, cada uno con un rol o especialidad, para resolver una tarea compleja. Se coordinan dividiendo el trabajo y compartiendo resultados.
Sobreajuste (overfitting)
Problema en el que un modelo memoriza los datos de entrenamiento, incluido su ruido, en lugar de aprender patrones generales. El resultado es un modelo que acierta en los ejemplos vistos pero falla con datos nuevos.
Sora
Modelo de OpenAI para generar vídeo a partir de texto. Produce clips coherentes con movimiento y física plausibles a partir de una descripción escrita.
Stable Diffusion
Modelo de difusión de texto a imagen de pesos abiertos. Al publicarse abiertamente, impulsó una enorme comunidad de herramientas, extensiones y modelos derivados para generar imágenes.
Subajuste (underfitting)
Situación en la que un modelo es demasiado simple o se ha entrenado poco y no logra captar los patrones de los datos. Rinde mal tanto en entrenamiento como en datos nuevos.
Superinteligencia artificial (ASI)
IA hipotética que superaría con amplitud la inteligencia humana en prácticamente todos los campos. Es un concepto especulativo, posterior a la AGI, central en los debates sobre seguridad de la IA.
Tasa de aprendizaje
Hiperparámetro que controla cuánto ajusta el modelo sus parámetros en cada paso de entrenamiento. Es uno de los valores más influyentes en si un modelo aprende bien o no.
Temperatura (en modelos de lenguaje)
Parámetro que regula cuánta aleatoriedad introduce un modelo al generar texto. Una temperatura baja produce respuestas más predecibles y deterministas; una alta, más variadas y creativas.
Texto a imagen
Generación de imágenes a partir de una descripción escrita. El usuario describe lo que quiere ver y el modelo crea una imagen acorde, normalmente mediante un modelo de difusión.
Texto a vídeo
Generación de clips de vídeo a partir de una descripción escrita. El modelo produce secuencias con movimiento y coherencia temporal a partir de un prompt.
Texto a voz (TTS)
Tecnología que convierte texto escrito en voz hablada con sonido natural. Se usa en asistentes, audiolibros, accesibilidad y narración automática.
Token
Un token es la unidad mínima de texto —una palabra, un fragmento de palabra, un signo o un carácter— en la que un modelo de lenguaje divide la entrada y la salida para poder procesarla.
Tokenización
Proceso de dividir un texto en unidades más pequeñas llamadas tokens, que pueden ser palabras, fragmentos de palabra o caracteres. Es el primer paso para que un modelo de lenguaje pueda procesar texto.
Top-p (muestreo de núcleo)
Método de muestreo que limita la elección del siguiente token al conjunto más pequeño cuya probabilidad acumulada alcanza un umbral p. Controla la diversidad del texto generado de forma más adaptativa que la temperatura.
TPU (Unidad de procesamiento tensorial)
Chip diseñado por Google específicamente para acelerar cargas de trabajo de machine learning. Está optimizado para las operaciones con tensores que dominan el entrenamiento de redes neuronales.
Transformer
Arquitectura de red neuronal, presentada por Google en 2017, que procesa secuencias completas en paralelo usando el mecanismo de atención. Es la base de los modelos de lenguaje modernos como GPT, Claude y Gemini.
Validación cruzada
Técnica para evaluar un modelo dividiendo los datos en varios bloques y entrenando y probando de forma rotativa. Ofrece una estimación más fiable del rendimiento que una sola partición.
Ventana de contexto
La ventana de contexto es la cantidad máxima de tokens (texto, código, imágenes o audio convertidos a unidades) que un modelo de lenguaje puede procesar a la vez, sumando la entrada del usuario y la respuesta generada.
Verdad de referencia (ground truth)
Conjunto de respuestas correctas verificadas que se usa como referencia para entrenar y evaluar modelos. Sin un ground truth fiable no se puede medir si un modelo acierta.
Visión artificial
Campo de la IA que permite a las máquinas interpretar imágenes y vídeo: detectar objetos, reconocer rostros, leer texto o segmentar escenas. Sustenta desde el desbloqueo facial hasta la conducción autónoma.
Voz a texto (STT)
Tecnología que transcribe el habla en texto. Es la base del dictado, los subtítulos automáticos y los comandos de voz.
Whisper
Modelo de reconocimiento de voz de OpenAI, de pesos abiertos, capaz de transcribir y traducir audio en muchos idiomas con buena precisión, incluso con ruido de fondo.
¿Quieres pasar de la teoría a la práctica? Ver el curso de inteligencia artificial en español (Aprende IA en 30 días).