Face aux masses de données disponibles, à la multitude d’outils existants et au caractère complexe des protocoles d’analyse de données scientifiques, reproduire une expérience est particulièrement difficile, comme en témoignent de nombreuses études récentes. ReProVirtuFlow est une action du GDR MaDICS qui vise à faire un état des lieux complet sur les approches existantes dans ce domaine en considérant en priorité comme éléments de solutions: (i) les workflows scientifiques (au sens large), (ii) la provenance des données, (iii) les machines virtuelles. Notre consortium regroupe des experts en bases de données, algorithmique, programmation, et environnements virtuels et des responsables de plateformes et centre de collecte de données scientifiques (biologie INSB et physique IN2P3).
Dans le cadre de notre action, nous lançons l'organisation d'une série de ReproHackathons visant à tester les capacités des systèmes de workflows disponibles à reproduire une expérience scientifique.