====== Séminaire Données de la recherche en SHS, Lille (MESH), 10 mars 2015 : les aspects juridiques ======
===== La politique d'ouverture des données publiques (ETALAB) =====
==== La mission ETALAB ====
2011 : création de la mission Etalab, rattachée au secrétariat général pour la modernisation de l’action publique.\\
Objectif : permettre la mise à disposition libre et gratuite des données publiques (Etat, établissements publics, collectivités territoriales, personnes privées et publiques avec mission de service public)
==== Les fondements d'une politique de l'open data ====
* Transparence, démocratie : la loi du 17.VII.1978 organise la possibilité pour le citoyen de demander communication de documents administratifs ⇒ début de la transparence de l’action publique\\
* Innovation : amélioration des services rendus à la population\\
* Modernisation de l’action publique : décloisonnement des administrations, meilleure prise de décision, meilleure allocation des dépenses publiques
==== Quelles données ouvrir ? ====
La loi de 1978 stipule que tout document, toute donnée relevant de la mission de service public est un document administratif qui doit être communiqué. « Doc admin » : définition très large (ex : code source d’un logiciel). Régime dérogatoire prévu pour secret défense, respect vie privée, droits propriété intellectuelle, secret délibérations du gouvernement. Etablissements ESR et culturels : accès permis, mais exception dans le droit pour la réutilisation des données. Etalab prône libre accès et libre réutilisation des données de fonctionnement (comptes…).\\
Partager les données produites par le service public, gratuitement, en formats ouverts, avec liberté de réutilisation, dans le respect des secrets légaux
La licence ETALAB est une licence ouverte introduite en décembre 2011. Compatible avec les licences Creative Commons, Open Knowlegde Foundation… Les licences CC sont destinées aux auteurs, donc ne conviennent pas aux administrations car les données produites ne relèvent pas du droit d’auteur, mais de l’accès aux documents administratifs.
==== Bonnes pratiques ====
* Portail data.gouv.fr : permet de voir les réutilisations des jeux de données déposés (« contributions communautaires »). Le dépôt est simplifié, avec seulement quelques champs de métadonnées et une publication immédiate. Le portail comprend des données brutes, de la visualisation de données…Valorisation du savoir-faire des réutilisateurs\\
* OpenFisca : simulateur informatique de la législation socio-fiscale. Permet de calculer des réformes. Le code de l’application est disponible sur Github. Il a permis de développer le site « mes aides » qui permet à chacun de simuler les aides auxquelles on peut postuler.
===== Les données de la recherche à l'INRA =====
==== Introduction ====
Il n'existe pas de définition légale ni de réglementation spécifique sur les données de la recherche. L'OCDE a publié des principes et lignes directrices pour l’accès aux données de la recherche publique : considère que les données de recherche sont les données définitives, pas les documents préparatoires.
La loi sur l'ESR de 2013 donne comme objectif la libre diffusion de la connaissance scientifique et prône l’utilisation de formats ouverts.\\
A retenir de la loi : pas de distinction entre données brutes, élaborées ou métadonnées. La base de données peut faire l’objet d’un droit de propriété, mais il n’y a pas de droit de propriété sur la donnée de recherche car c’est souvent une donnée machine. Exceptions : données qui peuvent être rattachées au droit d’auteur (textes, interviews, photos, cartes, représentations graphiques…), et données personnelles (qui permettent d’identifier une personne physique).
==== L'open data, au sens de la loi de 1978, s'applique-t-il ? ====
Oui, si l'employeur du chercheur est public : tout ce que le chercheur fait dans le cadre de sa mission peut être considéré comme un document administratif. Cas particulier des chercheurs et enseignants-chercheurs : les écrits, photos, plans…qui sont soumis au droit d’auteur appartiennent au chercheur. Mais lorsqu’il y a un contrat avec un partenaire privé, les droits appartiennent à l’employeur.
Les restrictions à l’accès peuvent concerner : le secret commercial et industriel, les données personnelles, le secret médical, la défense nationale, la sécurité des personnes, le secret statistique (cf. guide du secret statistique sur le site de l’INSEE), les contrats de prestations de services exécutés pour le compte de quelqu'un.
Focus sur les données environnementales : le code de l’environnement prévoit une diffusion non « refusable », sauf restrictions ci-dessus.
Données géographiques : la directive européenne INSPIRE prévoit leur interopérabilité et leur réutilisation (ex : géoportail de l'IGN)
==== Les données sont-elles réutilisables ? ====
Une donnée considérée comme un document administratif et réutilisable peut être réutilisée à toutes fins, y compris commerciales. Exceptions : données produites par les EPIC, données avec droit de propriété intellectuelle d’un tiers, données des établissements de l’ESR qui fixent eux-mêmes les conditions de réutilisation (par ex : fixer une redevance. Mais tendance forte à la gratuité).
prévoir une réutilisation sous licence : intégrité des données, mention de la source, date de dernière mise à jour, prix (option), restrictions d’utilisation (option), exclusivité (option), obligation du demandeurp
==== Précautions à prendre ====
* Auditer les données : quelle est l’origine des données ? (suis-je le producteur ?)\\
* S’assurer qu’on a bien le droit de diffuser les données (pas de données personnelles, pas de secret défense…)\\
* Anonymiser les données personnelles\\
* Séparer les données par type pour pouvoir gérer des droits d’accès différenciés\\
* Faire un data management plan, en accord avec les éventuels partenaires\\
* Prévoir une licence de réutilisation qui fixe les conditions d’utilisation
La licence ODBL, spécifique aux bases de données, peut être choisie si l'on a mis au point une base de données et que l'on souhaite contrôler les redistributions de la base et les travaux dérivés.
La licence Etalab peut être choisie si l’on a pas besoin d’un suivi sur le devenir des données et que les données sont distribuées en France. Pb pour les chercheurs : la licence ne reprend pas l’obligation de non dénaturation des données, prévue pourtant par la loi.
===== Propriété intellectuelle et données de la recherche =====
Complexité et méconnaissance des règles de la propriété intellectuelle : notions qui freinent parfois la diffusion de la production scientifique numérique.
La directive européenne sur le droit d’auteur est en cours de mise à jour.
comment concilier protection et libre accès ?
La donnée de recherche est susceptible de protection par la propriété intellectuelle si on respecte les conditions définies par le Code de la propriété intellectuelle (littéraire & artistique, ou industrielle).
==== Comment utiliser une oeuvre protégée ? ====
Pour utiliser une œuvre protégée, il faut demander au préalable l’autorisation par écrit au titulaire des droits.\\
⇒Expliquer le but poursuivi, le cercle de diffusion, les droits d’exploitation…\\
Mais il existe des exceptions (contenus mis à disposition librement) : contenus sous licence CC, bases de données diffusées librement, contenus qui autorisent explicitement l’utilisation à des fins de recherche (voir les conditions d’utilisation ou les mentions légales d’un site web), contenus du domaine public (données publiques, œuvres du domaine public).
Il est possible de recourir à l’exception de courte citation (critères : œuvre citante/œuvre citée, « courte », caractère polémique/critique/pédagogique/scientifique/d’information, respect du droit moral de l’auteur).\\ Attention : l’exception de courte citation ne s’applique pas aux œuvres des arts visuels.
Il est possible de recourir à l’exception pédagogique et de recherche : introduite par la directive européenne de 2001 (exception très large dans la directive, mais restreinte dans la transposition en droit français).\\ Autorisation d’utiliser des extraits d’œuvres, mais pas des œuvres complètes. Finalité : illustration pour l’enseignement ou la recherche. Public d’élèves, d’enseignants, de chercheurs. Aucune exploitation commerciale. Compensation financière (mise en place des accords sectoriels). \\
⇒ Ce n’est plus une exception, mais une licence avec des restrictions d’utilisation\\
Pb : l’exception ne peut être utilisée que dans le cas d’un espace numérique de travail réservé aux étudiants et aux enseignants de son établissement ⇒ utilisable seulement pour une diffusion intranet.\\
Autre pb : n’est pas compatible avec une licence ouverte de type CC.
Avant de créer ses données de recherche, se demander si les contenus que l’on souhaite utiliser sont protégés par un droit quelconque (propriété intellectuelle, droit à l’image…).
==== Comment protéger ses données de recherche avec la propriété intellectuelle ? ====
Il n'existe pas de définition légale d’une œuvre. Mais il existe deux conditions cumulatives pour protéger un contenu dans le code de la propriété intellectuelle : originalité de la création (la manière de créer les données porte l’empreinte de la personnalité de l’auteur), et la mise en forme de la création (forme de la communication au public).
Souvent, les données de la recherche sont diffusées sous la forme d’une base de données ⇒ possibilité d’utiliser le droit des bases de données, qui peut s’appliquer à des données brutes, ou élaborées, ou à des œuvres protégées. On peut protéger une base de données au nom du droit d’auteur pour l’architecture de la base (si originalité par la structure ou le choix du contenu) ⇒ nécessité d’autorisation pour l’utilisation de la base si pas de diffusion ouverte, et protection pendant 70 ans à partir de la mise à disposition du public.\\
En l’absence d’originalité, il est possible de protéger le travail par le droit //sui generis// : protection au profit du producteur (le producteur doit prouver qu’il a réalisé des investissements pour créer la base), pendant 15 ans, avec nécessité d’autorisation pour l’utilisation de la base.
Autres types de protection : droit des logiciels, brevets, enveloppe Solo à l’INPI, dépôt auprès d’un notaire
Qui est titulaire des droits ?\\
L’auteur d’une œuvre de l’esprit, sauf exception de service public (cession des droits d’exploitation). Cette exception ne s’applique pas aux enseignants et aux chercheurs ⇒ l’université doit obtenir l’autorisation de l’enseignant pour exploiter ses œuvres. Notion d’œuvre de collaboration si plusieurs coauteurs à égalité, de manière collaborative. Notion d’œuvre collective si la ressource est la création de plusieurs auteurs, mais sans travail collaboratif et si une personne est à l’initiative de l’œuvre l’édite, la publie et la divulgue sous sa direction : les droits d’exploitation appartiennent à la personne initiatrice.\\
En cas de double tutelle d’un chercheur, le chercheur est libre de suivre ou non la politique de la tutelle de son choix.
===== Les données de la recherche et la loi informatique et libertés =====
Loi informatique et libertés 1978 : traite des données personnelles. Depuis 2004, les établissements publics sont soumis à peu près aux mêmes contraintes en termes de données personnelles que les entreprises.
La loi s’applique aux personnes physiques. Le correspondant informatique et libertés de l’établissement doit tenir à jour un registre des traitements réalisés par l’établissement et il exerce une mission de conseil, ainsi qu'une mission de mises en place d’actions de formations.
Problème : la loi est quasiment inapplicable à la recherche en SHS\\
faire de la gestion du risque\\
Le CNRS a saisi la CNIL pour mettre au point un « pacte de conformité » afin de permettre la recherche en SHS.
Définition des données de recherche au CNRS : tout ce qui est produit entre le moment où on débute la recherche, et le moment où on publie.
Au sens de la loi de 1978, toute opération sur des données (ex : enregistrer sur son ordinateur), c’est un traitement. Mettre en ligne un corpus sur Huma-Num, c’est un traitement.
Données personnelles : elles permettent l’identification directe ou indirecte d’une personne physique. La loi ne s’applique pas aux personnes décédées. Anonymiser, ce n’est pas seulement enlever les noms et les prénoms, c’est aussi supprimer toute information permettant l’identification indirecte (X occupe telle fonction).
Pour que la loi s’applique, il faut que le traitement des données personnelles soit accessible via un fichier, c'est-à-dire tout ensemble structuré et stable de données à caractère personnel accessible selon des critères déterminés.
Données sensibles au sens de la loi : santé, vie sexuelle, origines raciales, options politiques ou religieuses, données génétiques, infractions pénales, biométriques, appréciations sur les difficultés sociales des personnes (subjectif), n° de sécurité sociale ⇒ interdiction de collecter ces données.\\ Exceptions : consentement expresse, intérêt public.\\
Consentement expresse : consentement écrit papier obligatoire
Une fois qu’on est dans un traitement de données personnelles, quelles sont les règles à appliquer ?\\
* Avoir une finalité conforme à la mission de son établissement : pour un projet de recherche\\
* Etre capable d’exprimer sa finalité, de manière pas trop générale (ex : « pour de la recherche » : trop général) ni trop précise\\
* Collecter les données pour remplir la finalité : collecter des données pertinentes et dont j’ai vraiment besoin pour mon projet de recherche ⇒ principe de pertinence et de proportionnalité des données : ne collecter que les données strictement pertinentes pour ma finalité\\
* Les données ne doivent être conservées que le temps nécessaire à l’accomplissement de l’objectif. A la fin du projet de recherche : destruction, mais exception : archivage des données présentant un intérêt scientifique, historique ou statistique.\\
* D'après le Code du patrimoine, les données de la recherche sont des données à archiver. Chaque laboratoire est censé avoir une politique d’archivage de ses données. Permet de résoudre la question de la conservation des données personnelles puisque ce sont des données de la recherche, donc qui doivent être archivées.\\
Voir les instructions de la section AURORE des Archives Nationales
* Principe de sécurité et de confidentialité : ne pas stocker sur un support mobile, sur Google Drive… Chiffrer son ordinateur portable.\\
* Principe d’information des personnes : informer de la finalité du traitement, du caractère obligatoire ou facultatif des réponses, de leurs droits (accès, rectification, opposition), échanges hors UE, identité du responsable.\\
* Problème de la collecte indirecte (ex : collecte sur les réseaux sociaux, réutilisation d’archives) : comment informer ? On doit informer lors de la première communication au public\\
NB : le CNRS prépare un guide à destination des chercheurs\\
* Principe du respect des droits des personnes : laisser à la personne la possibilité d’accéder, de modifier et de s’opposer au traitement.
En cas de réutilisation de données personnelles publiées : la loi informatique et libertés s’applique (information des personnes et finalité).