Projet Mobilisation Anti Trans

Résumé du projet

Ce projet vise à analyse les discours des organisations se mobilisant contre les droits des personnes trans'.

Requirements

Ce github nécessite python (version 3.9 de préférence), jupyter, R, RStudio et Quarto.

Il est possible d'installer l'ensemble des libraires python nécessaires avec : pip install -r requirements.txt

Le code R gère en son sein l'installation des librairies requises.

Explications d'utilisation des codes.

Analyse

Les analyses sont entièrement réalisées en R dans le fichier /src/analyse et figures.qmd qui peut être facilement lu et exécuté sur RStudio.

Ce code utilise le métadonnées des organisations collectées dans /data/Base de données anti trans.xlsx et les données textuelles lemmatisées /data/intermediate/base_lemmatized.csv.

Après avoir exécuté le premier bloc du .qmd (fonctionne comme un jupyter notebook), les différentes bibliothèques nécessaires devraient s'installer et certaines fonctions importées depuis /src/helpers. A ce moment, l'ensemble des blocs peut être exécuté avec un run all ou un render. Un render est conseillé et devrait donner un html consultable dans un navigateur web.

Il est impératif de mettre save_figures = F dans le premier bloc ou dans le cas contraire de créer le dossier /output/results pour avoir les figures dans ce dossier.

Fabrication de la base lemmatisée

Les métadonnées des sites scrappés sont présentés dans le /data/Base de données anti trans.xlsx.

Le dossier /data/text contient notamment les différents tsv (csv tabulé) qui regroupent les différents textes collectés (manuellement ou pas). Deux bases manuelles sont présentes l'une correspondant aux pdf (stockés dans /data/pdf, mis en base sous le nom de manuel2.tsv créé grâce à /src/Creation base manuelle 2.ipynb) et ceux récupérés par copié collé directement dans un fichier excel nommé manuel.xlsx. Chaque site scrappé automatiquement est contenu dans un .tsv créé par le code /src/scrapping_websites.ipynb. Ce code étant long, il est déconseillé de le faire tourner si on veut voir les résultats.

Les bases intermédiaires servant à d'autres étapes dans le processus sont mise dans /data/intermediate.

Le code /src/Merging.ipynb permet de fusionner toutes les bases en /data/intermediate/base_merged.csv

Le code /src/cleaning.ipynb part de la base fusionnée (merged), supprime les mots les moins fréquents (précisés dans /data/intermediate/words_to_filter.txt) et réalise la base lemmatisée (/data/intermediate/base_lemmatized.csv).

Exploration des noms de domaines

/src/scrapping_websites.ipynb permet de créer des réseaux interactifs de noms de domaines présents en lien sur des sites qui servent d'"origine" (seed). On a pu identifier quelques sites à partir de la Petite Sirène principalement avec cette méthode.

/data/network/ contient les données du scrapping de la Petite Sirène car l'opération est longue. Le code précédent peut permettre de le revoir de façon reproductible.

Malgré toutes ces remarques, cette partie du code sur les réseaux vu qu'elle était exploratoire est aussi la moins reproduite et reproductible. En particulier les données des différents réseaux trouvées ne pouvaient être mises sur le github pour une question de place.

Some ref

STM explanation STM github Tidytext

Name		Name	Last commit message	Last commit date
Latest commit History 110 Commits
.ipynb_checkpoints		.ipynb_checkpoints
data		data
src		src
.gitignore		.gitignore
PDSSS.Rproj		PDSSS.Rproj
README.md		README.md
Rapport.pdf		Rapport.pdf
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet Mobilisation Anti Trans

Résumé du projet

Requirements

Explications d'utilisation des codes.

Analyse

Fabrication de la base lemmatisée

Exploration des noms de domaines

Archive

Some ref

About

Releases

Packages

Contributors 2

Languages

LeoMaurice/Conservative_mobilisation

Folders and files

Latest commit

History

Repository files navigation

Projet Mobilisation Anti Trans

Résumé du projet

Requirements

Explications d'utilisation des codes.

Analyse

Fabrication de la base lemmatisée

Exploration des noms de domaines

Archive

Some ref

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages