LogoIST​   Qu’entend-on par données de la recherche ?


« Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. » (OCDE, Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds publics, 2007)


LogoIST​   Comment diffuser ses données ?


Plusieurs choix s’offrent à vous :

  • Déposer les données avec votre publication

Si vos données ont pour fonction principale de soutenir une publication, et qu’elles ne sont pas d’une taille trop importante, vous pouvez les déposer avec cette publication. La plupart des archives ouvertes, comme HAL ou ArXiv, permettent de déposer des fichiers annexes (complementary files) à une publication et de les décrire sommairement.

 

  • Déposer vos données dans un entrepôt disciplinaire

Si les données ne sont pas rattachées à une publication particulière, ou si la taille ou le format des fichiers ne permettent pas de les déposer dans une archive ouverte, il est possible de les déposer dans un entrepôt de données. Le répertoire re3data.org permet de rechercher parmi 1500 entrepôts de données, en fonction des types de fichiers à déposer, des disciplines concernées et des politiques de dépôt et de consultation… Certains entrepôts permettent de faire un lien entre les jeux de données et une publication

 

  • Déposer vos données dans un entrepôt généraliste

Si vous ne trouvez pas un entrepôt disciplinaire qui vous convient ou que vous souhaitez déposer des données issues de disciplines différentes, vous pouvez choisir un entrepôt de données généraliste, comme Zenodo


Zenodo, fournit par le projet OpenAIRE, vous permet de déposer n’importe quel type de fichiers, sans limitation de taille. Un DOI est attribué automatiquement aux données que vous y déposez pour faciliter leur citation.  Ils permettent aussi de choisir les modalités de diffusion de vos différents fichiers, notamment par la mise en place d’embargo.


OpenAire (Open Access Infrastructure for Research in Europe, à la fois un projet européen sur l’Open Access et un portail), moissonne HAL et d’autres archives ouvertes françaises. Il établit un lien entre la publication et les données de la recherche à partir du DOI.


Les critères auxquels devrait répondre un entrepôt de données :
  • Attribuer un identifiant unique et pérenne à vos données (ex. DOI) et rendre vos données citables.
  • Offrir une description de vos données (métadonnées) d’une qualité suffisante pour que d’autres chercheurs puissent les trouver et les réutiliser.
  • Gérer les accès à vos données selon vos besoins: délai d’embargo, possibilité d’accès restreint…
  • Permettre l’attribution d’une licence appropriée à vos données (ex. Creative commons)
  • Offrir des garanties de pérennité (certificat, institution en charge de l’entrepôt…)

 

LogoIST​   Rédiger un plan de gestion de données


Dans le cadre des projets H2020, il est nécessaire de fournir un plan de gestion des données (Data Management Plan ou DMP) dans les six premiers mois après le début du projet. 
Le Data Management Plan ou Plan de gestion de données est un document synthétique qui aide à organiser et anticiper toutes les étapes du cycle de vie de la donnée. Il explique pour chaque jeu de données comment seront gérées les données d’un projet, depuis leur création ou collecte jusqu’à leur partage et leur archivage. Le plan de gestion des données est un document qui précise :

  • la gestion des données de la recherche pendant et à l’issue du projet;
  • quelles données vont être collectées ou générées;
  • est-ce que les données seront en libre-accès et comment;
  • comment les données vont être archivées et conservées.

 

Des guides méthodologiques existent pour aider à la rédaction des DMP. La Commission Européenne fournit un document, traduit par l’Inist-Cnrs, Lignes directrices pour la gestion des données dans Horizon 2020 (version 3.0 mise à jour en juillet 2016), qui précise les lignes directrices à suivre pour la rédaction d’un DMP.


D’autre part, le Digital Curation Center, organisme britannique expert sur les données de la recherche, fournit un outil de création assistée de DMP en ligne : DMPOnline. Il intègre les obligations et recommandations des programmes H2020 et vous permet de produire rapidement un modèle de plan de gestion de données à compléter.


Les données nécessaires à la validation des résultats doivent être diffusées et librement accessibles, sauf dans des cas précis qui doivent être explicités où la diffusion des données pourrait :

  • gêner ou empêcher une exploitation commerciale ou industrielle est prévue,
  • mettre en danger la réalisation du projet de recherche,
  • contrevenir aux droits de propriété intellectuelle.

 

Pour aller + loin :

Consulter la page de sensibilisation à la gestion des données de recherche de l’Université Paris-Saclay

Consulter l'article sur arbido.ch
 

LogoIST   Les étapes pour publier un Data Paper

Il existe plusieurs moyens pour publier des données de recherche. Parmi eux, les data papers ont l'avantage d'être des articles à part entière, suivant la même logique de processus éditorial que les articles scientifiques classiques. cette vidéo vous résume comment se déroule la publication d'un data paper.

Une vidéo conçue par   logodoranum

LogoIST   Le dépôt des données en 5 questions

Pourquoi déposer ses données scientifiques ? Quelles données déposer ? Quand faut-il le faire ? Dans quel entrepôt ? Et comment procéder ? Quelques éléments de réponses dans cette vidéo

Une vidéo réalisée par  logo_doranum

LogoIST    Qu'est-ce qu'un entrepôt de données ?

Un des moyens pour partager des données de recherche est de les déposer dans un entrepôt de données. Mais qu'est-ce que c'est au juste un entrepôt de données ? Qu'est-ce qui les caractérise ? Comment trouver le bon entrepôt ? 

Une vidéo réalisée par  logo_doranum

LogoIST    Qu'est ce qu'un plan de gestion de données (Data Management Plan) ?

Le plan de gestion des données est un outil de gestion. Il se présente sous forme d'un document structuré en rubriques. Il a pour objectif de synthétiser la description et l'évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.

Une vidéo réalisée par  logo_doranum