Scripts python de test de generation de graph a partir de la base de l'Abes.
Le process est divisé en deux parties:
GenerateGenealogyGraph.py
: chargement du fichier csv source et extraction des informations de chaque thèse et création d'un graph associant candidats et directeurs avec NetworkX. Sauvegarde dans trois fichiers pickle.GetSubGraphPerPerson.py
: fonctions basiques de recherche dans le graph et de sortie du graph d'une personne donnée. Utilises les fichiers pickle de 1.
Sources de l'application Flask de www.genealogie-esr.fr.
- La base n'est pas forcément complète (des entrées presentent dans theses.fr ne sont pas dans la base)
- Souvent seul le directeur est renseigné (pas de co-encadrants)
- Le code n'est pas optimisé (ni bien documenté)
- La base de données des theses sur le site data.gouv.fr
- Python graph package NetworkX
- Python pandas package
- Python rapidFuzz package
- Python wordcloud package
- Une genealogie des Maths (mondiale): Mathematics Genealogy Project