Common Voice – DeepSpeech

Aggregatore degli strumenti per la generazione di un modello di machine learning per la lingua Italiana del progetto Common Voice. Ci trovi su Telegram con il nostro bot @mozitabot nel gruppo Developers dove dirigiamo e discutiamo lo sviluppo oppure sul forum.

Roadmap per lo sviluppo
Script (bash/python) per la generazione usando Docker, DeepSpeech, Tensorflow e Nvidia del modello
Il modello generato
Script per generare il corpus testuale per la parte predittiva del modello
Pacchetto di esempio su come è strutturato il dataset di Common Voice

Regole

Ticket e pull requests in inglese
Readme in Italiano

Utilizzare il modello

Scarica l'ultima versione da questa pagina.
Puoi provare il modello con un bot Telegram che compara il vocale con Google Speech.

$ virtualenv test --python=python3
$ source test/bin/activate
$ pip install deepspeech==0.7.0a1
$ deepspeech --model output_graph.pbmm --audio test.wav --trie trie --lm lm.binary

Generare il modello

$ cd $HOME
$ git clone MozillaItalia/DeepSpeech-Italian-Model.git
$ cd DeepSpeech-Italian-Model/DeepSpeech
$ docker build -f Dockerfile.train -t deepspeech .
$ cd $HOME
$ mkdir -p data/sources
$ chmod a+rwx -R data
$ mv it.tar.gz data/sources # versione 3 di common voice
$ chmod a+r data/sources/it.tar.gz
$ docker run --rm --gpus all --mount type=bind,src=/home/ubuntu/data,dst=/mnt deepspeech

Model at $HOME/data/models/it-it.zip

To configure docker parameters:

$ cat deepspeech.env
EARLY_STOP=0
EPOCHS=20
DROPOUT=0.5
$ docker run --env-file deepspeech.env --rm --gpus all --mount type=bind,src=/home/ubuntu/data,dst=/mnt deepspeech

Risorse

https://voice.mozilla.org/it
https://github.com/mozilla/DeepSpeech
https://github.com/mozilla/voice-corpus-tool
https://github.com/Common-Voice/sentence-collector
https://github.com/Common-Voice/commonvoice-fr - Il repository da cui questo è derivato
https://github.com/MozillaItalia/voice-web - Il dataset primario di frasi italiane lo manteniamo qui

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Common Voice – DeepSpeech

Regole

Utilizzare il modello

Generare il modello

Risorse

Files

README.md

Latest commit

History

README.md

File metadata and controls

Common Voice – DeepSpeech

Regole

Utilizzare il modello

Generare il modello

Risorse