|
|
Résumés des interventionsGestion des données de la recherche : politique nationale, réalisations de terrain et perspectives Résumé : Dès 2016, la loi pour une république numérique pose l’ambition d’ouvrir l’ensemble des produits et méthodes de la recherche, avec pour objectif une science plus cumulative, plus robuste, plus reproductible, mais aussi une science transparente et accessible à toutes et tous. Cette ambition est rappelée notamment dans le 2ème plan national pour la science ouverte, ainsi que dans la politique des données, des algorithmes et des codes sources portée par le Ministère de l’Enseignement Supérieur et de la Recherche. Comment cette politique se décline-t-elle dans la réalité ? Quelles actions concrètes sont mises en œuvre pour atteindre les objectifs visés, et comment cette politique trouve-t-elle écho dans le quotidien de la recherche ? En suivant les trois grandes thématiques de la journée (besoin des communautés, mutualisation et mise en réseau), la présentation proposera des réponses à ces questions, à la lumière d’exemples concrets et de perspectives pour l’avenir. ___ Session : Besoins des communautés scientifiques Les données en biologie: massives, hétérogènes et interdisciplinaires Résumé : Les évolutions techniques, du séquençage à la microscopie, ont fait de la biologie une science aux données massives, dont la gestion et l'analyse sont un enjeu majeur. Outre leur taille, les autres enjeux liés à la gestion des données biologiques sont leur hétérogénéité — elles sont toutes reliées entre elles tout en étant différentes — et le caractère très interdisciplinaire des collaborations, incluant des parties prenantes avec des besoins et des expertises très variés. La présentation abordera les données utilisées en biologie et leur exploitation, à travers l'exemple des données d'image issues de la microscopie, et la manière dont la communauté s'organise en France et à l'étranger pour les gérer. E4C DataHub : une plateforme pour le partage des données climat-énergie au service de l’interdisciplinarité Résumé : Le E4C DataHub est un outil conçu pour répondre aux défis spécifiques liés à la gestion des données énergie et climat-énergie. Cette présentation abordera les enjeux et les besoins identifiés lors de la conception de la plateforme, ainsi que les objectifs de gestion et de partage de ces données au sein de communautés scientifiques diverses. L’intégration et les interactions du E4C DataHub avec les différents centres de données existants seront également mentionnées. ___ Session : Infrastructures mutualisées : retours d'expérience IDOC : production et diffusion de données spatiales Résumé : En premier lieu, comment planifier les observations d'instruments spatiaux, opérer leur déroulé et sécuriser leur fonctionnement. Puis après avoir reçu et validé les données issues de ces instruments construire des ensembles interprétables pour les communautés scientifiques. Ensuite diffuser et promouvoir leur utilisation la plus aisée par les plus larges audiences en gagnant et conservant la confiance des partenaires. Veiller à assurer en parallèle la pérennité des jeux de données, leur identification et leur accessibilité durable. ESPRI, centre de calcul et de données de l'Institut Pierre Simon Laplace pour les sciences du climat Résumé : ESPRI (Ensemble de Services Pour la Recherche à l'IPSL) est le centre de calcul et de données de l'IPSL (Institut Pierre Simon Laplace). Il se consacre à la collecte, la gestion, le traitement et la distribution des données pour les sciences du climat, qu'il s'agisse de données d'observation ou de simulations numériques. Depuis plus de 20 ans, ESPRI organise l'accès à des jeux de données de référence et à des ressources de calcul de haute performance, par le biais d'une plateforme d'analyse de données partagée et multisite dédiée aux laboratoires de l'IPSL et à leurs partenaires. ESPRI s’est construit autour du principe de mutualisation et capitalise depuis de nombreuses années une expertise sur la gestion et l’exploitation de données sur l'ensemble des thématiques du système climatique. Cette expertise vaut à ESPRI d’être reconnu aujourd’hui comme un centre de calcul et de données de référence, ayant obtenu la certification internationale Core Trust Seal en janvier 2024. Nous présenterons les services proposés par ESPRI, en terme de gestion et valorisation des données, son infrastructure mutualisée, les étapes de la construction du service ainsi que les communautés utilisatrices. Le CASD – un dispositif d’accès sécurisé à des données confidentielles très détaillées Résumé : Le Groupement d’Intérêt Public Centre d’accès sécurisé aux données (CASD) a pour objet principal d’organiser et de mettre en œuvre des services d’accès sécurisé pour les données confidentielles à des fins non lucratives de recherche, d’étude, d’évaluation ou d’innovation. Les données mises à disposition, de part leur niveau de détail et leur sensibilité, sont soumises à divers secrets protégés par la loi : secret professionnel, secret statistique, secret fiscal, secret médical etc. Le potentiel de recherche sur ces données très riches est quasiment infini, mais les exploitations statistiques sont soumises à des contraintes de sécurité strictes, tant organisationnelles que techniques. Le CASD répond à ces contraintes tout en proposant un environnement de travail le plus confortable possible pour les chercheurs. Environ 600 projets de recherche en cours sont hébergés sur les serveurs du CASD, utilisant plus de 600 sources de données très diverses : impôts, assurance maladie, enquêtes de la statistique publique etc. ___ Session : Quel écosystème de la donnée sur le plateau de Saclay ? Table ronde : Services et infrastructures locaux de la donnée : quels besoins communs ? Résumé : De part et d’autre du plateau de Saclay, infrastructures et services d’appui à la recherche se développent pour accompagner et proposer des solutions de gestion et traitement des données de la recherche aux communautés scientifiques. Après un rapide tour d’horizon des services existants et en devenir, la table ronde sera l’occasion d’échanger avec les participants pour identifier les besoins communs et les manières dont ces différents services pourront y répondre à court et moyen termes. Atelier : Vers un mésocentre du plateau de Saclay Résumé : L'objectif de cet atelier sera de mettre en phase les besoins exprimés des communautés de recherche du Plateau avec les infrastructures techniques en place et à venir dans le projet de création d'un centre de calcul et de données du Plateau de Saclay. Atelier : Un outil pour référencer et accéder aux services et infrastructures du plateau ? Résumé : L’objectif de cet atelier sera de réfléchir à l’opportunité de mettre en place un outil pour référencer les services et infrastructures proposés sur le plateau de Saclay. Il sera l’occasion d’identifier les fonctionnalités et formes requises pour permettre aux communautés scientifiques d’accéder facilement aux informations recherchées. |
Personnes connectées : 2 | Vie privée | Accessibilité |
![]() ![]() |