For better transcription in more languages, Implement Massively Multilingual Speech - Meta's Open Source model with less than half of Whispers error rate #4

menelic · 2023-05-26T10:48:57Z

Because of the error rate viz and above al speaker detection your whisper ui is better for research use than all the others I have tried. Please consider implementing Meta's MMS with speech recognition and generation support for over 1000 languages at a drastically reduced error rate compared to Whisper:

https://github.com/facebookresearch/fairseq/tree/main/examples/mms

https://ai.facebook.com/blog/multilingual-model-speech-recognition/

jojojaeger · 2023-05-29T07:05:56Z

sounds great, i will try it out!

menelic · 2023-06-14T18:17:19Z

have you had the chance to check it out?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

For better transcription in more languages, Implement Massively Multilingual Speech - Meta's Open Source model with less than half of Whispers error rate #4

For better transcription in more languages, Implement Massively Multilingual Speech - Meta's Open Source model with less than half of Whispers error rate #4

menelic commented May 26, 2023

jojojaeger commented May 29, 2023

menelic commented Jun 14, 2023

For better transcription in more languages, Implement Massively Multilingual Speech - Meta's Open Source model with less than half of Whispers error rate #4

For better transcription in more languages, Implement Massively Multilingual Speech - Meta's Open Source model with less than half of Whispers error rate #4

Comments

menelic commented May 26, 2023

jojojaeger commented May 29, 2023

menelic commented Jun 14, 2023