Desafio Speedio para a vaga de Ciência de Dados. Resultado final do projeto Speedio-test/excel/estabelecimentos.xlsx
:
-
Este projeto utiliza a ferramenta de terminal
mongoimport
, que precisa ser instalada separadamente do MongoDB. Link para download: MongoDB Database Tools. Depois de instalada a ferramenta, siga uma das duas seguintes opções:- Adicionar o caminho do arquivo mongoimport.exe a variável de ambiente PATH. Obs: Certifique-se de que o caminho do arquivo está correto. Exemplo: C:\ProgramFiles\MongoDB\Tools\100\bin
- Substituir o comando
mongoimport
no scriptSpeedio-test/writer.py (linha 56)
pelo caminho completo do arquivo mongoimport.exe. Exemplo (ANTES/DEPOIS):
- Certifique-se de instalar as libs presentes no arquivo
requirements.txt
utilizando o comandopip install -r requirements.txt
no terminal. - Finalmente, extraia o zip contendo o arquivo CSV a ser processado no diretório
Speedio-test/raw
. Garanta que o nome do arquivo seja K3241.K03200Y0.D10612.csv. - Rode o script
Speedio-test/main.py
e aguarde a execução do código. Obs: certifique-se que o MomgoDB está rodando corretamente!
O programa levou em média 5~6 minutos para finalizar a execução de acordo com os testes realizados. A máquina utilizada para rodar os testes tem as seguintes especificações:
- Sistema Operacional: Windows 10 Pro
- Prcessador: i5 9400f (6 núcleos, 2.90 GHz clock base e 4.10 GHz clock max)
- Memória: 8GB DDR4
- Disco: SSD 240GB
ATENÇÃO: O desempenho pode váriar de acordo com o a máquina uitilizada. Quanto mais potente o processador e mais memória RAM disponível, melhor. Também é extremamente recomendável o uso de um SSD no lugar do HD.
Este programa foi desenvolvido e testado no Windows 10. O funcionamento em outros Sistemas Operacionais não é garantido.
Créditos: Eduardo Franco