Gemini

Familia de modelos multimodales de Google DeepMind capaz de procesar texto, imágenes, audio y vídeo. Se integra en los productos de Google y se ofrece por API.

Familia de modelos multimodales de Google DeepMind capaz de procesar texto, imágenes, audio y vídeo. Se integra en los productos de Google y se ofrece por API.

Actualizado: 3 de junio de 2026.

Gemini es la apuesta de Google en LLM de frontera, diseñada desde el principio como modelo multimodal. Se ejecuta sobre las TPU de Google y alimenta su buscador, su suite ofimática y su asistente.

Multimodalidad nativa

A diferencia de modelos que añaden visión a posteriori, Gemini se entrenó para combinar varios tipos de datos de forma integrada.

En el ecosistema

Junto a GPT y Claude, forma el trío de modelos cerrados punteros, accesibles mediante API de IA.