Research data SUB Göttingen : travailler sur le contrôle qualité des projets de recherché : s’assurer que les projets soumis par les chercheurs aux organismes de financement sont bons.
https://rdminsight.wordpress.com/
Argument pour convaincre les chercheurs de faire du RDM : l’argument de la compliance envers les exigences des financeurs peut être problématique (peut être vu comme une menace). Arguments à utiliser : faire gagner du temps, apporter un soutien personnalisé
Tenir compte des différences disciplinaires : en sciences dures, partager les données est souvent naturel ; en sciences de l’ingénieur, il y a souvent un intérêt commercial car il y a des coopérations avec industrie ; en médecine, il y a des problèmes de confidentialité ; en SHS, il y a une méconnaissance du terme de « données ».
Changer les habitudes : peut être difficile car les disciplines s’organisent en dehors des institutions ⇒ quelle peut être l’influence d’une politique institutionnelle ?
Attention : volume des données (big data, little data, no data) ? qu’est-ce-que sont les données (parfois appelées sources primaires, assemblage complexe de différentes formes…) ? où sont les données ?
Partager n’est pas naturel : ai-je publié tout ce que je voulais à partir de ces données ? Qui pourrait vouloir mes données, car elles sont très spécifiques ? Où sont mes données ? et quelle version des données partager ? Suis-je sûre de la méthodologie employée ? Risque d’être contredit/contrôlé par d’autres collègues ? Ai-je demandé à tous les participants du projet s’ils étaient ok pour partager ? avec qui le chercheur avec qui je partage va-t-il partager ? je n’ai pas le temps de partager
Les BU doivent comprendre la valeur que les chercheurs accordent à leurs données, et les conséquences des différences disciplinaires, et doivent comprendre comment les chercheurs travaillent. Connaître le type de données produites, l’environnement de travail…
Travail mené par Research Libraries UK pour la formation des bibliothécaires : focus groups avec des chercheurs, dans différentes disciplines pour tester et définir les typologies : examiner les volumes des différents types de données produites, etc. puis dépouiller et regrouper en grands thèmes ⇒ex : comment les chercheurs génèrent et travaillent ils leurs données et dans quel but ? ⇒ élaboration de méthodes de curation et de collecte.
Boîte à outils et centre de ressources en ligne pour les data librarians. Wiki : UK research data community wiki (avec liste des projets, liste des standards, des taxonomies…) https://wiki.research.data.ac.uk/Main_Page
Strates de données de la recherche : restricted data, published data, shared data and reused data, open access data
Workflow : les producteurs de données sont responsables de la qualité des données : ils les produisent et les déposent dans les entrepôts. Puis, les gestionnaires de l'entrepôt préservent les métadonnées et l’accès (mais ne sont pas responsables de la qualité des données). Puis, réutilisation des données.
☞Garantir la compliance éthique et juridique est crucial
☞Partenaires qui doivent travailler ensemble : bibliothécaires, informaticiens, chercheurs, financeurs des projets de recherche ⇒ le DMP fait le lien entre les différents partenaires
☞Partage des rôles et des responsabilités
Projet en Autriche de DMP au niveau national. DMP concentré sur H2020. Se base sur la checklist du DCC, version 4, mais personnalisée pour l’aligner sur les situations locales et les services et infrastructures locaux. Le pilote a été lancé avec 7 composantes de l’Université de Vienne. Le pilote devrait être étendu à d’autres institutions en Autriche à partir de septembre. Le DMP est un logiciel en ligne (DMPonline), avec plusieurs thèmes (réutilisation, archivage pérenne…). Le DMP est le même pour toutes les disciplines.
Premières conclusions du pilote :
POlitique de l'université sur les données (fin 2013) : dépôt des données et des métadonnées au plus tard au moment de la publication. Stockage au moins pour 20 ans. Recommandation de faire un DMP. L’université offre des services en soutien. Pas encore d’entrepôt pour les données : utilisation du CRIS. Mais la politique n’est pas vraiment appliquée⇒ même si la politique est définie de manière centrale, le relais doit être pris au niveau décentralisé pour son application.
Définir une politique institutionnelle ne répond pas aux questions pratiques des chercheurs : les chercheurs ont besoin d'un soutien sur mesure. Pour faire ça, la BU a travaillé à une checklist avec les labos avec les questions auxquelles les labos doivent répondre telles que : un DMP doit-il être élaboré avant la collecte des données ? Si oui, quels sont les prérequis de la part de l’institution ? Les coûts peuvent-ils être financés par les financeurs de la recherche ? Pour chaque question, des tableaux, des arbres de décision, des fiches pratiques, etc. sont fournis⇒ travail décentralisé
Points forts de la BU : service stable et pérenne, point de contact entre les différents partenaires impliqués, connait les chercheurs et leurs besoins.
Politique de l'université sur les données : mai 2011 ! Initiative pilotée par la BU, avec la participation de « academic champions ». La politique n’est pas un mandat, mais elle insiste sur les services offerts.
Partage des responsabilités entre l’université (gestion des données pendant le cycle de vie, fournit formation et soutien et conseils, services de stockage, d’archivage, de signalement, protection des intérêts des chercheurs) et les chercheurs.
Services pour appliquer la politique :
Data Stewardship : curation, accès et conservation, métadonnées, DOI. Fait par la BU (catalogueurs, data librarians…)
DMP : DMPonline personnalisé. Avant la collecte et la création des données.
Formation des bibliothécaires à la gestion des données.
Travail en cours : faire travailler ensemble les différents services afin que les chercheurs aient une vision claire et cohérente des processus, et des interlocuteurs identifiés.
Lister les bénéfices pour le chercheur. Aligner et harmoniser les procédures et les processus (obtention de financements, appels à projet, DMP…) pour qu’il n’y ait pas de redondance.
En Finlande et au Danemark, on a commencé par la mise en place des infrastructures et des services, puis on est passé à l’élaboration de la politique, afin que tout soit en place quand la politique devient effective.
Faire attention aux questions juridiques et aux questions de propriété.
Soutien aux chercheurs : privilégier le face à face. On mesure le succès au fait que le chercheur se souvient de vous et de la manière de vous contacter.
DMP : cycle de vie des données ⇒ permet de prendre des décisions en connaissance de cause ; permet au chercheur de savoir dès le début ce qu’il fera sur le long terme
Description des données à collecter et à créer ; standard et méthodes ; partage et réutilisation…
Soutien à l'utilisation des DMP : fournir des templates, des listes de questions et de thèmes, des guides pour personnalisation des DMP, des liens vers des contacts locaux…
DMPonline : aider les chercheurs à écrire leur DMP. Propose templates pour les différentes situations. Les templates peuvent être personnalisés par une institution.
Le DCC met à disposition des guidelines pour évaluer les DMP.
Politique de l'université sur les données : février 2015.
Formation des équipes en interne avec un expert du Finnish Social Science Data Archive + travail en réseau avec les autres services de l’université (direction recherche, informatique…).
Création d’une équipe RDM à la BU et organisation d'ateliers pour cette équipe (thèmes des ateliers : comment simplifier la préparation des DMP et comment aller voir les chercheurs ? Comment améliorer son expertise par l’auto-foramtion ? comment s’organiser pour continuer après H2020 ? comment travailler en équipe ?).
Equipe de 5 personnes, qui font du RDM à 20-50 % de leur ETP. La direction de la recherche a envoyé les chercheurs qui soumettaient un projet H2020 à la BU pour une évaluation de leur DMP. La BU utilise Libanswers comme help desk.
Evaluation du DMP avec l’aide, si nécessaire, d’autres services de l’université (service juridique, informatique…) : l’équipe pose ensuite des questions aux chercheurs pour avoir des précisions, et propose des conseils aux chercheurs (exemple sur la sécurité des données : ne pas utiliser de disque dur externe pour les données sensibles)
A venir :
Consultation publique Science 2.0
Ce qui en sort :
Evaluation de l’impact de la recherche : important pour les financeurs de la recherche. Comment démontrer que la recherche a contribué à des changements ?
Démontrer l’impact
Altmetrics : tracer les research outputs dans des sources non-traditionnelles (nouvelles, blogs, réseaux sociaux…). Comprendre comment la recherche est reçue et comprise : complémentaire de la bibliométrie traditionnelle. Permet d’évaluer un impact plus large que la bibliométrie traditionnelle, en dehors des cercles académiques : grand public, presse…
Permet de s’intéresser à autre chose que les articles. Permet de mettre en valeur de jeunes chercheurs, qui sont désavantagés par la bibliométrie traditionnelle. Permet d’avoir un feedback en temps réel. Permet d’avoir des indicateurs plus qualitatifs.
Altmetrics pour les institutions :
Création d’une base de données pour une institution. Permet d’encourager les chercheurs à déposer dans l’AO : altmetrics peuvent être intégrés à l’AO ou à un CRIS. Possible d’évaluer l’effet d’une mise en OA d’un article. 37% des publications Top 100 de 2014 étaient en OA.
Implémentation à University of Manchester :
Déjà un « citation services » à la BU : analyse bibliométrique traditionnelle avec SciVal, mais service limité
et nécessité de démontrer impact plus large.
Utilisation des statistiques d’usage de l’AO, mais insuffisant
Avantage de l’application Altmetrics for institution : met les discussions sur un sujet de recherche en contexte (ex : contexte d’un tweet).
La BU fournit des données à Altmetrics (API de l’AO).
Permet aux bibliothèques d’engager un dialogue avec les chercheurs : le bibliothécaire peut repérer une discussion sur twitter, contacter le chercheur concerné, lui parler d’OA… Permet à l’université d’identifier les chercheurs qui ont un fort impact sur la société.
A l’avenir : partager l’outil avec d’autres services de l’université (University Press : choisir les ouvrages à publier…). Utilisation de l’application pour évaluer l’impact des articles en OA gold financés par l’université, pour évaluer l’impact des données de recherche déposées dans l’AO…
Pour les institutions UK, nécessité d’avoir une information structurées pour les procédures d’évaluation de la recherche (REF) ⇒ utilisation du CRIS. La BU effectue le nettoyage des données sur la production de recherche qui sont soumises au REF. Le REF exige désormais une étude d’impact de la recherche
L’institution a besoin d’établir une stratégie de recherche, d’exploiter les résultats de l’évaluation de sa recherche, d’étudier son impact, de faire du benchmarking, de lever des fonds pour la recherche.
University of St Andrews : partenariat Direction de la Recherche/BU pour la mise en place du CRIS. Utilisation de PURE (Elsevier).
Ce qui entre dans le CRIS :
Lien avec AO pour full text des publications et les données qui sont dans l’AO
Format CERIF (EuroCRIS)
Interopérabilité !
Objectif : simplifier la vie du chercheur pour qu’il n’ait plus à s’occuper de compliance, d’évaluation, de travail administratif. Utiliser un seul système et réutiliser les informations.
Travail collaboratif. S’adapter aux besoins et pratiques existantes des chercheurs. Simplifier les processus. Permet d’augmenter le nombre de dépôts et de full text (passage de 44 à 60% de full text).
Les chercheurs doivent déposer leurs données dans un entrepôt ⇒ lequel ? La science, c'est pouvoir reproduire les expériences et les résultats, et avoir confiance dans les résultats ⇒besoin d’open data
Re3data : Répertoire d'entrepôts de données de la recherche. Couvre toutes les disciplines. Aide les chercheurs, les bibliothécaires… à trouver un entrepôt. Promotion de l’open data pour les données de recherche.
Début du projet en 2012. Version 2.2. Projet avec Purdue University, GFZ, Humboldt Universität, KIT Karlsruhe.
L'entrepôt doit donner des informations sur :
Typologie des entrepôts : institutionnelle, disciplinaire, multidisciplinaire, projet
Les entrepôts qui adoptent le plus les bonnes pratiques (identifiants pérennes, certification…) sont en SHS !
Re3data est inclus dans les guidelines de H2020, dans celles de Nature…
Il est possible d’intégrer rR3data dans la politique “données de la recherche” de son institution, en disant que les données doivent être déposées dans un entrepôt figurant dans re3data.
Coopération avec DataCite, OpenAire, DINI, BioSharing, RDA. Groupe de travail avec DataCite. Financement de la maintenance technique par Datacite à partir de 2016. Les développements futurs seront pilotés par DataCite.
Technique : restful API, opensearch, documentation en ligne, métadonnées ouvertes, engagement du KIT pour un hébergement sur le long terme. Métadonnées sous licence CC-0.
Gestion des données de la recherche dans le Bade-Wurtemberg.
Volonté d’avoir un research data support efficace.
Projet financé par le ministère de l'enseignement supérieur du Bade-Wurtemberg. Financement 2014-juin 2015. 1 M€. 9 ETP, un dans chaque université partenaire, et un coordinateur. Chefs de projets : centres de calculs des universités, associés aux BU.
De quelles infrastructures et services avons-nous besoin pour faire de la région un leader dans ce domaine ?
Travail avec les chercheurs : réalisation d'une enquête de besoins pour définir les améliorations à apporter par rapport à la situation actuelle.
700 entretiens avec des chercheurs :
2550 user stories ont été extraites des entretiens.
Présentation des résultats et des recommandations au ministre en juillet 2015.
Résultats :
La publication chez un éditeur rapporte quelque chose de symbolique au chercheur, et ce symbolique se transforme en avantages matériels en terme de carrière.
SHS : modèle économique de l’édition est un peu différent ; les coûts des APC sont plus faibles. Eparpillement des coûts. Pour l’instant, les coûts sont supportables.
Monographies :
Une solution : modèle d'Open Library of Humanities. Megajournal. Le modèle économique est similaire à Knowledge Unlatched. Les BU sont partenaires : elles participent à la gouvernance, et financent la publication.
2008 : Netherlands coalitation for digital preservation
Partage d’expérience et projets pratiques communs.
2014 : début du travail avec les enhanced publications. Article dans Liber quarterly en 2014
1ère étape : qu’est-ce-que les institutions partenaires considèrent comme une enhanced publication ?
Qui conserve quoi, et quelles sont les relations entre les différentes parties ?
Deux types de contenus : le contenu ajouté par l’auteur, le contenu ajouté par celui qui détient le contenu.
Etude de cas avec les thèses de doctorat. Les docteurs sont obligés de déposer un exemplaire électronique, mais rien n’est organisé pour les données liées, il n'y a pas de règles pour les identifiants pérennes et les métadonnées. Où conserver les données liées ?
Les thèses sont déposées dans l’AO de l’institution, les métadonnées sont envoyées dans NARCIS. La bibliothèque royale moissonne DANS pour les MD et récupère le fichier de l’AO ⇒ l'archivage pérenne de la publication est assuré. Quid des données ? Le docteur peut faire appel aux datacenters 3TU ou DANS, mais comment se fait le lien avec le fichier de la thèse, et avec DANS ? Pas de lien !
Objectifs :
Politique OA des agences de financement fédérales au Canada : les publications doivent être en OA vert ou gold Elaboration en cours d’une politique sur les données.
Queen’s university : publication du strategic agenda. Pour l’élaborer : état des lieux des besoins, entretiens avec des chercheurs et avec des fournisseurs de services (centres de calcul…)
Stipule que les services informatiques et la BU travaillent ensemble à la mise en place d’une infrastructure distribuée pour les données.
Projet PORTAGE : création d’un réseau d’experts en gestion des données à travers le pays + création d’un outil de recherche. Création d’un outil de création de DMP national, générique, et bilingue (avec DMPonline) (en cours de tests. Prêt en septembre 2015).
Faire en sorte que l’organisation soit transparente pour le chercheur : le chercheur s’en fiche de savoir si c’est la BU, le services informatique… qui lui rend service.
Les services de gestion des données sont organisés autour de 4 grandes fonctions :
Gouvernance : research community comitee pour le pilotage + 2 groupes de travail avec des membres de toute l’université (research data working group ; scholarly communications working group).
Organisation d’un data day annuel : info pour les chercheurs, promotion de l’OA pour les données, ateliers pratiques (visualisation, sécurité, écriture d’un DMP)
Travail pour inclure la gestion des données dans la charte d’éthique de la recherche.
Réorganisation de la BU autour des disciplines avec renforcement des liaisons librarians disciplinaires + services transversaux ⇒ collaboration pour la gestion des données entre le service transversal et les bibliothèques disciplinaires.
- Transparency in open science Les data librarians sont des « transparency agents » : promotion d’un changement de culture, induit par l’open science. Les RH sont aussi importantes que l’infrastructure technique.
2012 : le blog The Scientist propose un Transparency Index 2013 : Reproducibility Project : étude de la reproductabilité de 50° études phares en cancérologie. Publication des résultats fin 2014
Juin 2014 : partenariat GigasCience & Publons pour open peer review. Publications et données. Possibilité d’accéder et de réutiliser les reviews.
Inclure transparency dans les politiques de recherche de l’université : la politique doit comprendre le soutien à l’OA, le soutien à la « citizen science » et la transparency Inclure la transparency dans les séances de sensibilisation des chercheurs au RDM. Inclure la transparency dans les workflows
Ecole des sciences de l’info de Pittsburgh : inclut transparency dans la formation aux RDM pour les nouveaux bibs, et dans la formation continue Projet de recherche en 2015 sur la transparency et les bibliothécaires : que savent les bibs ? Quelle est leur attitude ?
- What does it take to make networked and open science sustainable ? Open Science : donne un cadre plus cohérent et plus global que OA. OA est un des moyens de open science.
Communication scientifique : ce n’est pas un cycle de vie, c’est un réseau ⇒ différents réseaux à interconnecter : renforcer la collaboration globale et l’engagement local
Pour facilier l’interconnextion des réseaux : ensure scholarship can be used, ensure scholarship is re-used and re-usable
Services ! Besoin d’information utilisable par les machines (DOI, DataCite, euroCRIS, ORCID, TDM…) CrossRef DET Pilot : a way to track activities around DOI. OUvrir le peer review ! Faire un continuum du peer review, du preprint au postprint Initiative ESAC : contribuer à rendre le marché des APC transparent. Sortir du cercle restreint du monde univesitaire : grand public, partenaires privés, patients… Besoin d’open metrics : cf PLOS article level metrics Système actuel de la publication scientifique est maintenu par l’incapacité des chercheurs à sortir du facteur d’impact Avoir des politiques qui récompensent les chercheurs qui s’investissent dans l’open science. Ex : prix ASAP (récompense chercheurs qui utilisent OA) Vision globale : open science, open behaviour du chercheur Actuellement : besoin d’accéder aux différentes versions d’une publi ⇒ les revues actuelles ne le permettent pas. Capital symbolique des éditeurs commerciaux se traduit dans les montants des abonnements et dans les montants des APC. Article-level metrics : peut être utilisé à la place de l’impact factor Intelligent openness : ne pas ouvrir pour ouvrir. Reconnaître qu’il faut aussi de la confidentialité, du temps pour l’analyse…Autoriser les variations de politique selon les disciplines, selon les étapes du travail de recherche. Avoir une approche réaliste et intégrée : ne pas avoir une politique pour les publis, une pour les données, une pour les ressources pédagogiques…