Alors que le mot « data » fait parfois peur, évoquant pour certains l’accès non autorisé à nos données personnelles à des fins frauduleuses, la donnée ouverte semble constituer une réelle opportunité dans un ensemble de domaines lié à l’éducation. Chercheurs, enseignants, et bien entendu, étudiants ont tous besoin d’accéder à des données pour enrichir des travaux de recherche, documenter des contenus pédagogiques ou valider leurs projets et leurs études. Mais que faut-il comprendre lorsque l’on parle de données ouvertes ?
Le mouvement de l’Open Data, né aux Etats-Unis et en Grande-Bretagne, a pour objectif d’ouvrir et de rendre accessible les données produites et collectés par les acteurs exerçant une mission de service public. Il concerne ainsi toutes les administrations, les établissements publics et privés qui doivent publier tout document administratif relatif à une mission de service public. Mais ils doivent également respecter la règlementation, notamment celle relative à la protection des données personnelles. Une fois publiée, les données peuvent être réutilisées par toute personne qui le souhaite à condition qu’elle respecte les dispositions du CRPA (code des relations entre le public et l’administration) et du RGPD (règlement général sur la protection des données).
Qu’est-ce qu’une donnée ?
« Les données sont le niveau d’abstraction le plus bas, duquel on retire l’information puis des connaissances », David Tarrant – Open Data Institute.
Data.gouv.fr est la plateforme ouverte de données publiques françaises. C’est une plateforme ouverte et communautaire sur laquelle tout le monde a la possibilité de publier !
Elle s’adresse :
- aux producteurs de données qui souhaitent les publier dans des formats ouverts et réutilisables ;
- aux réutilisateurs qui téléchargent les données et référencent leurs réalisations ;
- mais aussi à tout citoyen, association ou entreprise, qui peuvent ainsi découvrir et utiliser des données ouvertes.
Ce sont aujourd’hui plus de 41.000 jeux de données disponibles, et près de 94.000 utilisateurs.
Mise à disposition des données publiques en Open Data – Synthèse des feuilles de route ministérielles – Sept 2021
Avant d’exploiter pleinement la richesse d’un modèle collaboratif, prônant l’échange et l’ouverture, tous les publics sont d’abord concernés par l’enjeu de la sécurité. En effet, la donnée ne revêt un intérêt majeur pour la science, pour l’éducation et l’étude de l’évolution de nos sociétés qu’à la condition d’être suffisamment protégée de tous ceux qui cherchent à en faire une exploitation frauduleuse.
Pour les chercheurs et conformément au Plan National pour la Science Ouverte, le partage et la diffusion des données de recherche nécessitent leur mise en conformité avec les principes F.A.I.R. :
- Faciles à (re)trouver
- Accessibles
- Interopérables
- Réutilisables
Il s’agit donc avant toute chose d’adopter des bonnes pratiques dans la gestion de ses données tel que le suggère ce guide de l’université de Strasbourg.
Les réflexions menées par différents groupes de travail réunissant des chercheurs d’organismes nationaux de recherche et d’universités, le plus souvent avec le soutien du Comité pour la Science Ouverte, permettent d’accompagner les chercheurs dans leur démarche d’« Open data ». Ces réflexions permettent à la fois de motiver, de rassurer mais surtout d’aider les chercheurs à définir ce qu’ils peuvent et doivent faire en matière d’ouverture de données. Mais ils devront toujours se souvenir du principe « aussi ouverte que possible, aussi fermée que nécessaire » !
Mais alors pourquoi ouvrir les données de la recherche ?
Rendre accessible ses données de recherche offre aux chercheurs plusieurs avantages :
1/ Cela offre une plus grande visibilité à ses travaux. Et il est ici certain que tout chercheur qui nous lit sait à quel point il est frustrant d’attendre parfois plusieurs années la parution d’un article dans une revue scientifique.
2/ Cela accroit la transparence de la méthodologie et permet la réplication du travail de recherche. Là encore tous les chercheurs savent à quel point il est important pour la crédibilité scientifique d’assurer la reproductibilité de ses résultats de recherche.
3/ Cela favorise aussi le développement des collaborations de recherche avec d’autres chercheurs sur des domaines parfois connexes.
Néanmoins une fois convaincu par l’idée qu’il est important de rendre ses données de recherche accessible, encore faut-il savoir comment d’y prendre.
L’université Paris-Saclay propose une démarche documentée mobilisant trois types de compétences : administratives, techniques et juridiques.
Qu’en est-il pour les enseignants et leurs étudiants ? Comment appréhendent-ils l’Open Data ?
Partout en France et dans le monde, de nombreux enseignants s’appuient sur de la donnée ouverte pour alimenter leurs cours. L’utilisation de données régulièrement mises à jour, leur accès « libre » permet alors d’analyser nombre de phénomènes sociologiques, économiques et même politiques. Il ne s’agit plus seulement de données scientifiques liées à des résultats d’expériences et d’observations en laboratoire, mais bien plus largement des données démographiques, sociales, économiques, comportementales …
Pour optimiser l’usage de ces données, il est alors nécessaire d’informer et de former les enseignants tant sur le plan juridique que sur le plan technique. Ainsi, un cadre théorique autour des définitions, des principales plateformes et acteurs déterminera clairement les enjeux, tandis qu’une formation à des compétences techniques assurera la manipulation des données par les enseignants dans le respect des bonnes pratiques.
Du côté étudiant, au-delà de l’apprentissage du cadre théorique de l’open data, les étudiants doivent développer des compétences techniques liées à la donnée. Trouver des données publiques pertinentes pour un projet, nettoyer et traiter ces données, créer des représentations graphiques (graphiques, cartes interactives …) sont autant de compétences qui doivent être acquises durant les études.
L’utilisation de ces ressources ouvertes favorisent la transversalité des compétences, l’esprit d’analyse mais aussi l’esprit critique et le sens de la recherche chez les jeunes publics. Certains travaux d’analyse de données complexes permettent aussi de créer de la connaissance sur les sujets étudiés par les étudiants au cours de leur apprentissage.
On trouvera, par exemple, les jeux de données complets sur les différentes éditions de la Fête de la Science sur le site open data de l’ESR. Un accès à chacune des plus de 5000 manifestations, avec leurs thématiques précises, les lieux, les acteurs concernés, donnant ainsi une visibilité détaillée du programme et des intervenants. De quoi documenter un travail sur la promotion de la science et des avancées scientifiques françaises en direction du grand public, national et international !
De l’intérêt des données ouvertes pour tous
L’open data n’est pas un sujet réservé aux scientifiques ou à l’administration. Il concerne l’ensemble de la société et doit permettre de rapprocher les citoyens quels que soient leur métier, leur niveau d’étude, leur origine sociale ou leur lieu de résidence. Le développement de la science participative est à ce titre un très bon exemple du décloisonnement entre science et société.
Déjà 173 observatoires participatifs des espèces et de la nature rassemblant plus de 75.000 participants observateurs de la biodiversité qui partagent leurs données d’observation avec des scientifiques.
Dans le domaine de l’éducation, l’Institut International de Planification de l’Éducation de l’UNESCO promeut l’utilisation des données ouvertes sur les écoles pour établir des relations de confiance entre toutes les parties prenantes des communautés scolaires.
L’accès à la donnée permet de mieux comprendre le fonctionnement des établissements et leur impact sur le niveau de formation de la jeunesse, pas seulement en France, bien sûr mais au niveau mondial. Selon l’IIEP-UNESCO qui conduit un programme de recherche pour examiner les pratiques des écoles partout dans le monde, cela doit garantir à terme un accès, pour tous à une éducation de qualité.
Ainsi pour l’ONG Link Education, au Malawi, qui a décidé d’utiliser les données ouvertes sur les écoles pour promouvoir des approches collaboratives de la planification : « Auparavant les décisions relatives à la gestion de l’école étaient prises par une poignée de membres du personnel scolaire sans vraiment impliquer les parents ou la communauté, même si tout le monde au Malawi savait que ce type d’arrangement était propice à la corruption. »
En France, le ministère de l’éducation s’est engagé en rendant accessible 28 jeux de données via le portail data.education.gouv. La plateforme est régulièrement mise à jour et enrichie afin d’assurer les quatre grands principes de la transparence, de la qualité (de la donnée), de la performance (facilité d’usage et options de visualisations) et de l’accompagnement à la prise en main. Ainsi citoyens et publics de l’enseignement sont parfaitement capables de s’informer sur le fonctionnement de notre système éducatif.
L’usage des données ouvertes est sans aucun doute une réelle opportunité de progrès pour l’enseignement et la recherche. C’est à la fois une source d’innovation formidable pour la pédagogie, une garantie de transparence et la voie vers un accès du plus grand nombre à la connaissance. Tous les acteurs de l’éducation doivent s’emparer du sujet, se former à un usage éthique et responsable de la donnée, pour poursuivre avec succès leur mission universelle.
Pour aller plus loin, (re)découvrez l’interview de Matt Sonnati, CEO d’Inokufu, une base de données de learning objects !