Skip to content

Latest commit

 

History

History
60 lines (48 loc) · 2.52 KB

README.md

File metadata and controls

60 lines (48 loc) · 2.52 KB

Common Voice – DeepSpeech

Aggregatore degli strumenti per la generazione di un modello di machine learning per la lingua Italiana del progetto Common Voice. Ci trovi su Telegram con il nostro bot @mozitabot nel gruppo Developers dove dirigiamo e discutiamo lo sviluppo oppure sul forum.

Regole

  • Ticket e pull requests in inglese
  • Readme in Italiano

Utilizzare il modello

Scarica l'ultima versione da questa pagina.
Puoi provare il modello con un bot Telegram che compara il vocale con Google Speech.

$ virtualenv test --python=python3
$ source test/bin/activate
$ pip install deepspeech==0.7.0a1
$ deepspeech --model output_graph.pbmm --audio test.wav --trie trie --lm lm.binary

Generare il modello

$ cd $HOME
$ git clone MozillaItalia/DeepSpeech-Italian-Model.git
$ cd DeepSpeech-Italian-Model/DeepSpeech
$ docker build -f Dockerfile.train -t deepspeech .
$ cd $HOME
$ mkdir -p data/sources
$ chmod a+rwx -R data
$ mv it.tar.gz data/sources # versione 3 di common voice
$ chmod a+r data/sources/it.tar.gz
$ docker run --rm --gpus all --mount type=bind,src=/home/ubuntu/data,dst=/mnt deepspeech

Model at $HOME/data/models/it-it.zip

To configure docker parameters:

$ cat deepspeech.env
EARLY_STOP=0
EPOCHS=20
DROPOUT=0.5
$ docker run --env-file deepspeech.env --rm --gpus all --mount type=bind,src=/home/ubuntu/data,dst=/mnt deepspeech

Risorse