Reconocimiento de voz
Tecnología que convierte el habla en texto. Permite dictar, transcribir reuniones y dar órdenes por voz a asistentes y dispositivos.
Tecnología que convierte el habla en texto. Permite dictar, transcribir reuniones y dar órdenes por voz a asistentes y dispositivos.
Actualizado: 3 de junio de 2026.
El reconocimiento de voz analiza la señal de audio y predice las palabras pronunciadas. Los modelos modernos basados en deep learning, como Whisper, funcionan en muchos idiomas y con ruido de fondo.
Voz a texto
Es lo mismo que STT (speech-to-text). Su contraparte es el TTS, que convierte texto en voz.
Usos
Subtítulos automáticos, transcripción de entrevistas, comandos de voz en asistentes virtuales y accesibilidad para personas con dificultades motrices.