Estoy interesado en el software de reconocimiento de voz para Windows, que toma un archivo de audio de un podcast, digamos, en uno de los formatos estándar (MP3, WAV, OGG, etc.), y genera una transcripción del discurso como un Archivo de texto. La motivación es ayudar en la transcripción de podcasts para un wiki oficial.
Me gustaría poder enseñarlo, mejorar el reconocimiento de voz o aprender nuevas palabras. Además, debería ser capaz de soportar la conversación de varias personas, el habla superpuesta ocasionalmente y la música ocasional o los sonidos que no son del habla.
Solo necesito el software para trabajar con inglés.