Sobre esta herramienta
Transcribe audios y videos en 90+ idiomas con Whisper.
IA gratis para pasar audio a texto. Transcripción automática de podcasts, reuniones y videos. Online, sin registro.
Búsquedas relacionadas
Cómo usar Audio a texto
-
1
Escribe o sube
Escribe lo que quieres en el cuadro de arriba — o sube el archivo si la herramienta lo pide.
-
2
Genera
Click en el botón principal. Esperar 2-30 segundos según el modelo y el tamaño del input.
-
3
Descarga o comparte
Descarga el resultado o comparte el link directo. Sin marca de agua, listo para usar.
Preguntas frecuentes
¿Audio a texto es gratis y sin marca de audio?
Audio a texto no añade marca de agua audible en el archivo exportado. Los modelos open-source como Kokoro son 100% gratis sin límite estricto; modelos premium (ElevenLabs, Cartesia Sonic) descuentan tokens — una cuenta gratis trae 500 iniciales y 25 cada día.
¿En cuántos idiomas funciona Audio a texto?
Audio a texto soporta entre 30 y 90+ idiomas según el modelo elegido. ElevenLabs Multilingual v2 cubre 30+ con acentos locales; Whisper reconoce 90+ idiomas en transcripción; Kokoro está optimizado para inglés y español. El picker muestra los idiomas soportados para cada voz.
¿Qué formatos de audio acepta y exporta Audio a texto?
Audio a texto exporta MP3 por defecto (192 kbps, compatible con todo). Para subir archivos a transcribir acepta MP3, WAV, M4A, OGG, WebM, FLAC y los formatos de video comunes (MP4, MOV) — extraemos el audio automáticamente. Límite de 200 MB por archivo en la web.
¿Puedo clonar una voz con Audio a texto?
La clonación de voz solo está disponible con modelos premium específicos y requiere consentimiento del propietario de la voz. Bloqueamos uploads que parecen impersonar a figuras públicas vivas sin permiso. Para uso legítimo (tu propia voz, voiceover comercial con licencia) contáctanos.
¿Audio a texto guarda los audios subidos o generados?
Los audios generados quedan en tu cuenta con un link compartible que tú controlas — puedes hacerlos privados cuando quieras. Los archivos que subes para transcribir o procesar se borran automáticamente a los 7 días. Nada se usa para entrenar modelos.