Reconocimiento de voz

Tecnología que convierte el habla en texto. Permite dictar, transcribir reuniones y dar órdenes por voz a asistentes y dispositivos.

Tecnología que convierte el habla en texto. Permite dictar, transcribir reuniones y dar órdenes por voz a asistentes y dispositivos.

Actualizado: 3 de junio de 2026.

El reconocimiento de voz analiza la señal de audio y predice las palabras pronunciadas. Los modelos modernos basados en deep learning, como Whisper, funcionan en muchos idiomas y con ruido de fondo.

Voz a texto

Es lo mismo que STT (speech-to-text). Su contraparte es el TTS, que convierte texto en voz.

Usos

Subtítulos automáticos, transcripción de entrevistas, comandos de voz en asistentes virtuales y accesibilidad para personas con dificultades motrices.