Lien vers l'application dashboardauchanscraping.streamlit.app
AuchanScraping est un projet réalisé en groupe dans le cadre de notre formation en Big Data et Cloud Computing à l'ENSAE de Dakar au premier semestre d'ISE2. L'objectif du projet est de scraper les données du site Auchan Sénégal, puis de les visualiser dans un tableau de bord interactif construit avec Streamlit.
Le projet est organisé en deux parties principales :
- ScrapyWorkspace : Ce dossier contient le code pour scraper le site Auchan Sénégal à l'aide de Scrapy.
- AppStreamlit : Ce dossier contient l'application Streamlit, qui génère le tableau de bord interactif à partir des données scrappées.
Nous avons initialement travaillé sur deux répertoires GitHub distincts : un pour le scraping et un pour le tableau de bord. La version finale du projet est fusionnée dans la branche main
.
Le fichier webSite_structure.md constitue le fruit d'une analyse minitieuse de la structure et des convention adopte par le site Auchan SN.
Un aperçu de l'interface de notre dashboard.
Une vidéo YouTube, faisant office de guide utilisateur, est disponible à l'adresse suivante : Regarder la vidéo
-
Clonez le dépôt et placez-vous dans le dossier AuchanScraping via un terminal :
git clone https://github.com/Mafieuu/AuchanScraping cd AuchanScraping
-
Créez un environnement virtuel et activez-le :
python -m venv venv source venv\bin\activate # Sur MacOS/Linux source venv/Scripts/activate # Sur Windows
-
Installez les dépendances :
pip install -r requirements.txt
Pour démarrer l'application Streamlit, accédez au dossier AppStreamlit
et lancez :
streamlit run app.py
Cela ouvrira l'interface Streamlit dans votre navigateur.
Depuis le dossier ScrapyWorkspace
, lancez le scraping en exécutant la commande suivante :
scrapy crawl auchan
Le scraping récupérera les données d'Auchan Sénégal et les enregistrera dans notre base de données AWS.
Ce projet a été réalisé en deux semaines par :
- Ndeye Fama Diop
- Maty NDione
- Famara Sadio
- Larry Sandjo
- Moussa Dieme
Suggestions et Remarques
Nous sommes ouverts à toutes les suggestions et remarques qui pourraient améliorer ce projet. N'hésitez pas à partager vos idées, retours ou signaler des problèmes en ouvrant une issue sur ce dépôt. Nous ferons de notre mieux pour y répondre rapidement et intégrer vos retours. Merci.