L'Open Data : point de rencontre entre le libre et les données publiques

02 juillet 2012

Eléonore Varet

L'Open Data [1] : Point de rencontre entre le libre [2] et les données publiques

Quel est le point commun entre l’application Treesnearyou[3] qui localise et décrit sur smartphone les arbres new-yorkais, l’application développée par handimap.org[4] qui permet de rechercher un itinéraire en fonction de l’accessibilité des lieux et le site Mondéputé.fr qui répertorie l’ensemble des votes d’un député sur les textes importants[5] ?

Ces trois initiatives ainsi que beaucoup d’autres ont été développées en réutilisant des données publiques. Un mouvement mondial est en effet à l’œuvre consistant pour chaque pays[6], voire chaque ville, à définir et mettre en pratique une stratégie de valorisation de ses données publiques. Ce mouvement, encore imprévisible et hétérogène, repose sur l’idée que la réutilisation des données publiques doit promouvoir la transparence gouvernementale, permettre de stimuler l’innovation et, par conséquent, soutenir la croissance économique.

Ainsi des initiatives fleurissent tout autour du globe. Si la France est en retard par rapport à l’Angleterre, aux Etats-Unis, à l’Australie ou la Nouvelle Zélande, des projets se développent néanmoins à l’échelle nationale, avec le lancement d’Etalab, comme à l’échelle locale[7]. Etalab a ainsi pour mission de créer « un portail unique interministériel destiné à rassembler et à mettre à disposition librement l'ensemble des informations publiques de l'État, de ses établissements publics administratifs et, si elles le souhaitent, des collectivités territoriales et des personnes de droit public ou de droit privé chargées d'une mission de service public »[8] et vocation à devenir un puissant agrégateur de contenus doté d’un moteur de recherche. Bien qu’à ses débuts et pour l’instant principalement cantonné au développement de nouvelles applications, les espoirs de voir le mouvement Open data s’étendre et les réutilisations se diversifier sont nombreux.

Pour autant, le cadre législatif et réglementaire régissant la réutilisation des données publiques n’est pas nouveau. C’est l’ordonnance n°2005-650 du 6 juin 2005 relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques[9], transposant en droit interne la directive n°2003/98/CE du Parlement européen et du Conseil du 17 novembre 2003 relative à la réutilisation des informations du secteur public, qui a inséré de nouveaux articles 10 à 19 dans la loi n°78-753 du 17 juillet 1978 portant diverses mesures d'amélioration des relations entre l'administration et le public et diverses dispositions d'ordre administratif, social et fiscal. Un décret n°2005-1755 du 30 décembre 2005[10] a complété ce dispositif en modifiant le fonctionnement de la Commission d’Accès aux Documents Administratifs (« CADA ») et en précisant les règles applicables à la publication, la communication et la réutilisation des informations publiques.

Ce droit de réutilisation des données publiques, garanti par la CADA, n’a pourtant pas immédiatement suscité l’intérêt. Ce n’est que récemment, avec le développement toujours plus rapide des technologies de l’information, et notamment les bouleversements dans le traitement des données et l’explosion des smartphones, que les entreprises privées ont manifesté un intérêt pour les données publiques et que l’administration a pris conscience des profits qu’elle pouvait tirer de son patrimoine immatériel en entrant sur un marché évalué à 27 milliards d’euros[11] et qui pourrait atteindre 40 milliards d’euros[12].

Aujourd’hui, les demandes de réutilisation s’intensifient et renouvèlent les enjeux de la diffusion des données publiques. L’émergence d’un droit général à l’information, impliquant l’accès des citoyens aux documents administratifs, devient accessoire par rapport à l’enjeu que représente la diffusion des données publiques dans la société civile et commerciale. Cette diffusion libre des données est au cœur du mouvement Open data, véritable point de rencontre entre le « libre » et les données publiques.

Sous un angle juridique, cet article propose de réfléchir sur la définition d’information publique afin de mieux appréhender les contours de l’Open data et présente de manière synthétique les caractéristiques des nouvelles licences ouvertes développées dans le cadre de ce mouvement, à la lumière des particularismes juridiques du logiciel libre. Le régime juridique de l’Open data est en effet largement inspiré de celui du logiciel libre, œuvre emblématique du mouvement « libre ». Il repose largement sur les licences.

1.     L’information publique, une donnée libre ?

Là où le logiciel est libre[13] par la volonté de son auteur de garantir dans le cadre d’un contrat de licence certaines libertés aux utilisateurs en leur permettant un accès à ses sources, la donnée publique serait libre par essence et sa réutilisation ne nécessiterait pas d’autorisation préalable de l’administration, sauf dans les cas où la loi la subordonne à la délivrance d’une licence.

L’examen attentif de la définition d’information publique conduit toutefois à tempérer ce postulat. En effet, si par essence la donnée publique est libre, la définition restrictive qui en est donnée à l’article 10 de la loi de 1978 ainsi que les nombreux tempéraments au principe de libre réutilisation réduisent cette liberté à une peau de chagrin.

Sous l’appellation « informations publiques », les données publiques sont définies comme « les informations figurant dans des documents produits ou reçus » par « l’État, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d'une telle mission ». L’information publique est donc définie positivement par référence à la notion d’administration, laissant penser que les documents produits par des opérateurs privés chargés d’une mission de service public seraient de facto exclus du régime légal et que seules les informations produites ou reçues par des administrations dans le cadre d’une mission de service public seraient des informations publiques.

Cet amalgame entre « document administratif » et « information publique » ne permet pas une distinction nette entre le droit d’accès des administrés aux documents administratifs, lequel implique une démarche volontaire d’un individu, et le droit de réutilisation de l’information publique par des opérateurs publics ou privés, d’exercice en principe libre. Il s’agit pourtant de démarches bien différentes[14].

La définition négative qui figure à l’alinéa 2 de l’article 10 de la loi de 1978 limite encore le champ des données publiques en excluant expressément[15] :

-         « les informations contenues dans des documents dont la communication ne constitue pas un droit au sens de l’article 6 de la loi, sauf si ces informations font l’objet d’une diffusion publique », ce qui recouvre par exemple les documents couverts par le secret ou relatifs à la recherche ;

-         les informations publiques « produites ou reçues par les administrations dans le cadre d’une mission de service public à caractère industriel et commercial », ce qui laisse penser que seules les données produites dans le cadre d’un service public à caractère administratif sont librement communicables ce qui est particulièrement regrettable tant le potentiel d’innovation est fort sur ce type de données ;

-         l’échange d’informations publiques entre l'État, les collectivités territoriales ainsi que les autres personnes de droit public ou les personnes chargées d'une mission de service public ;

-         les documents « sur lesquels des tiers détiennent des droits de propriété intellectuelle », étant précisé que l’administration est tenue de les identifier conformément à l’article 25 de la loi de 1978[16]. Sur ce point, l’article 10 semble renvoyer notamment à la loi du 1er août 2006 relative au droit d’auteur et aux droits voisins dans la société de l’information (loi DAVDSI)[17] ayant reconnu à titre de principe le droit d’auteur des agents publics et profondément modifié la gestion par les administrations des droits de leurs agents, notamment en cas de d’exploitation commerciale des œuvres créées par ces derniers. A cet égard, la CADA a confirmé dans un avis du 5 novembre 2009[18] que si l’article L.131-3-1 du Code de la Propriété Intellectuelle prévoit une exception au droit d’auteur des agents publics lorsque l’œuvre est strictement nécessaire à l’accomplissement de missions de service public[19], la réutilisation par des tiers n’entre pas dans le champ de cette exception puisqu’elle ne pouvait être considérée comme « nécessaire à l’accomplissement de missions de service public ». En conséquence, dès lors qu’un agent public ou un tiers détient un droit de propriété intellectuelle sur un document, la réutilisation des données contenues dans ce document sort du champ d’application de la loi.

A y regarder de près, cette liberté inhérente au statut d’information publique se révèle bien relative, compte tenu de la définition restrictive retenue. De même, alors qu’à première vue, le principe de libre réutilisation est affirmé, de nombreuses restrictions y sont en réalité apportées par la loi.

D’abord, la réutilisation d’une information publique ne peut être faite qu’à « d’autres fins que celles de la mission de service public pour les besoins de laquelle les documents ont été produits ou reçus ». Ensuite, l’article 11 de la loi de 1978 dispose que les établissements et institutions d’enseignement et de recherche et les établissements, organismes ou services culturels sont libres de déterminer leurs propres règles d’utilisation des données publiques. Il ne s’agit donc pas moins de la possibilité pour certains acteurs publics de s’exclure de la politique d’ouverture des données publiques. En tout état de cause, ce régime d’exception conduit de facto à exclure la réutilisation d’une quantité substantielle de données.

La loi dispose encore que « la réutilisation d’informations publiques contenant des données à caractère personnel est subordonnée au respect des dispositions de la loi n°78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés »[20]. La présence de données personnelles dans les informations publiques n’est donc pas un obstacle à leur réutilisation par des opérateurs publics ou privés, mais implique le respect des formalités préalables à la mise en œuvre d’un traitement de données personnelles, prévues dans la même loi.

Enfin, l’article 12 de la loi de 1978 dispose que « la réutilisation des informations publiques est soumise à la condition que ces dernières ne soient pas altérées, que leur sens ne soit pas dénaturé et que leur source et la date de leur dernière mise à jour soient mentionnées », sauf accord de l’administration. Il s’agit de la consécration du principe d’intégrité des informations publiques qui, comme expliqué ci-après, peut s’avérer un frein à la libre réutilisation des données publiques.

L’examen attentif de la définition légale d’information publique et du régime de réutilisation des données publiques montre que les données publiques sont soumises à une « liberté conditionnelle » et qu’il reste du chemin à parcourir pour les libérer véritablement… Le périmètre des données qui doivent obligatoirement être publiées ou mises en ligne est très restreint, sans compter la plus ou moins bonne volonté des administrations à participer au mouvement d’ouverture de l’accès aux données publiques.

De ce point de vue, là où le logiciel libre est parvenu à trouver sa place dans l’économie numérique, il n’est pas certain que la seule réutilisation des informations publiques permette seule le succès de l’Open data. Faute d’extension du champ des informations publiques, c’est la libération par des entreprises privées de leurs propres données, démarche d’ores et déjà engagée par de nombreuses entités, qui viendra au secours de la définition restrictive d’informations publiques retenue par le législateur.

2.    Les licences ouvertes à l’épreuve de la réutilisation des informations publiques

Par opposition au logiciel « propriétaire », le logiciel libre repose sur la mise à disposition du code source du programme par son développeur afin de garantir aux utilisateurs la liberté d'exécuter le programme pour tous usages, la liberté d'étudier son fonctionnement, de l'adapter à ses besoins et de l’améliorer et la liberté de redistribuer le programme et ses améliorations au public. L’accès au code source est une condition essentielle d’exercice de ces libertés et du partage des améliorations par la communauté. La mise en œuvre de ces libertés s’opère par le biais d’un contrat de licence, expression du consentement initial de l’auteur à la diffusion de son œuvre sous certaines conditions.

Calquée sur ce schéma, bien qu’elle ne soit pas conditionnée par les mêmes contraintes techniques, la réutilisation des données publiques suppose également un accès aux données et s’opère habituellement par le biais d’un contrat de licence qui en fixe les conditions.

Si le recours à la licence n’est obligatoire en vertu de l’article 16 de la loi du 17 juillet 1978 que dans les hypothèses où la réutilisation est soumise à redevance[21], en pratique la licence s’impose comme une nécessité pour réguler la réutilisation des informations publiques, même à titre gratuit. A cet égard, la pertinence du critère de gratuité est contestable, la gratuité n’impliquant pas nécessairement un renoncement à fixer les contours de la réutilisation des données publiques concernées.

Au contraire, les licences ont une valeur informative très importante puisqu’elles permettent d’expliciter aux utilisateurs les principes qui gouvernent la réutilisation des informations publiques concernées. A condition d’être rédigée de manière claire, la licence est en effet génératrice de sécurité juridique et même lorsque les données ne sont pas protégées par le droit d’auteur ou le droit sui generis du producteur de base de données, le recours à la licence permet aux utilisateurs de comprendre les modalités de réutilisation autorisées.

L’examen des différentes licences utilisées dans le cadre des projets d’ouverture des données publiques révèle plusieurs difficultés. D’une part, comme c’est le cas pour le logiciel libre, la coexistence de plusieurs licences ayant chacune des spécificités impliquant des règles d’utilisation propres peut être nuisible. D’autre part, le principe d’intégrité des données vient parfois freiner la libre rediffusion.

L’hétérogénéité des licences risque en effet, comme c’est le cas pour le logiciel libre, de complexifier la chaîne contractuelle et d’être source d’insécurité, les réutilisateurs de données publiques étant contraints de composer avec les subtilités de chacune et d’évaluer leur compatibilité. La promotion de l’émergence d’une licence unique ou d’une famille de licences compatibles au niveau européen est un des points de convergence des acteurs et observateurs du mouvement Open data. Elle figure d’ailleurs au rang des propositions émises par le Conseil National du Numérique dans son avis du 5 juin 2012[22].

S’agissant du principe d’intégrité des données, la difficulté tient à l’identification de ce que recouvre concrètement cette exigence. Faut-il l’entendre comme la réservation du droit de modification ou davantage comme une interdiction de dénaturer le sens des données ? Cette notion, dont le non respect peut être sanctionné par la CADA en application de l’article 18, est spécifique au droit des données publiques et source d’incertitudes, ces contours restant flous.

En l’état du mouvement Open data, les licences développées se heurtent en effet à ce principe d’intégrité. Puisque la loi n’aborde l’évolution des données sources et l’accès aux sources des améliorations, consubstantiels à la liberté de rediffusion, qu’au travers du principe d’intégrité, et n’impose pas un modèle de licence, les licences diverses utilisées reproduisent mot pour mot les stipulations de l’article 12, sans plus de précision. Rares sont en effet les licences qui explicitent ce que peut caractériser une altération des données ou les usages autorisés et prohibés à ce titre.

Certaines administrations, de peur d’y contrevenir, limitent encore davantage la libre rediffusion en interdisant, par exemple, la concession de sous-licence. Dans ce cas, elles outrepassent les exigences de l’article 12. Le principe d’intégrité peut d’ailleurs constituer un bon prétexte pour l’administration lorsqu’elle n’entend pas faire droit à une demande de communication d’informations publiques entrant dans le champ de la loi de 1978[23]. Sa mise en œuvre pratique reste donc problématique.

Ainsi là où la libre rediffusion des sources et améliorations est effective sous les licences de logiciels libres (parfois sous la réserve d’être diffusées sous la même licence dans le cas des licences dites « virales »), le principe d’intégrité des données entrave cette liberté sous certaines licences Open data.

Seule la rediffusion intégrale à des tiers des données publiques sans enrichissement devrait pouvoir être limitée. Or, bien souvent, les limitations s’appliquent même lorsque les informations publiques ont été enrichies ou sont inclues dans un nouveau produit. Il n’y a pas une distinction nette entre les cas où les données sources « renaissent » en quelque sorte sous une autre forme et ceux où elles sont intégrées dans un produit/service. Dans ce dernier cas, les réutilisateurs de produits et services réalisés à partir d’informations publiques hériteront des limitations définies en vertu l’article 12 précité et il faudra alors faire preuve d’inventivité pour réutiliser ces œuvres intégrant des données publiques sous licences mixtes. Par conséquent, le principe d’intégrité risque de constituer un frein au développement du mouvement Open data, sa mise en œuvre pratique ne permettant pas de garantir totalement la libre rediffusion.

*          *          *

L’Open data, au sens de l’exploitation par des opérateurs économiques des données publiques, n’en est qu’à ses débuts. Est-ce que ce mouvement deviendra le puissant levier de performance espéré ? A ce stade, malgré les prédictions, personne n’est capable de mesure l’impact de ce nouveau modèle ouvert. D’un point de vue juridique, on retiendra qu’afin d’atteindre pleinement cet objectif d’utilisation facilitée à même de soutenir l’économie de ce nouveau modèle ouvert, une extension du champ des données publiques et de la liberté de rediffusion ainsi qu’une amélioration de la compatibilité des licences s’avèreront nécessaires. La révision de la directive européenne 2003/98/CE[24] concernant la réutilisation des informations du secteur public contribuera certainement à la clarification du cadre juridique pour une meilleure valorisation des données publiques.

Eléonore Varet, avocat à la Cour, Bird&Bird AARPI [25]







[1] Une donnée ouverte (en anglais, Open data) est une information publique librement accessible et réutilisable.



[2] Le terme « libre » reflète la philosophie d’un mouvement tourné vers la libre diffusion des œuvres mais recouvre en réalité aussi bien des œuvres libres de droits (notamment les œuvres du domaine public) que des œuvres sous licences « ouvertes » dont les  modalités de partage sont précisément définies.



[3] http://www.treesnearyou.com




[5] http://www.mon-depute.fr



[6] Barack Obama a annoncé dès janvier 2009, au lendemain de son investiture, l’engagement de son administration à plus de transparence, notamment grâce à un accès facilité aux données publiques. Des programmes similaires ont été définis à ce jour en Australie, en Angleterre, au Danemark, en Espagne, en France et en Nouvelle-Zélande.



[7] Par exemple, le lancement d’opendata.paris.fr. Du 21 au 26 mai dernier s’est tenue à Nantes, la première semaine européenne de l’Open data. Les villes de Paris, Rennes, Montpellier, Bordeaux, Toulouse et Nantes se sont d’ores et déjà lancé dans l’Open data et le mouvement continue de se diffuser dans l’hexagone.



[8] Le décret n° 2011-194 du 21 février 2011 portant création d'une mission « Etalab » chargée de la création d'un portail unique interministériel des données publiques a été publié au JORF n°0044 du 22 février 2011 page 3248
texte n° 2.



[9] JORF n°131 du 7 juin 2005 page 10022 texte n° 13.



[10] JORF n°304 du 31 décembre 2005 page 20827 texte n° 119.



[11] Le marché de la réutilisation des données publiques en Europe a été évalué par la Commission Européenne à 27 milliards d’euros sur la base d’une étude réalisée en 2006 (le rapport Measuring European Public Sector Information Resources, dit « MEPSIR », accessible sur le site internet de la Commission Européenne).



[12] Review of recent studies on PSI re-use and related market developments, Graham Vickery, 2011.



[13] Selon la définition qui en est donnée au Journal Officiel de la République (n°93 du 20 avril 2007), le logiciel libre est un logiciel distribué avec l’intégralité de ses programmes-sources (code source), afin que l’ensemble des utilisateurs qui l’emploient puisse le redistribuer à leur tour.



[14] Voir à ce sujet: Données publiques: la confusion des genres de l’ordonnance du 6 juin 2005, JM Bruguière, JCP (E) n°46, 17 Novembre 2005, 1625. De l’accès à la réutilisation : le nouveau régime applicable aux données publiques, B. Tabaka, Lamy Droit de l’immatériel, 2005, juillet/août, p.46. Liberté d’accès aux documents administratifs et réutilisation des informations publiques, B. Delaunay, AJDA 2006 p.1377.



[15] Voir les avis de la CADA, publiés sur son site : www.cada.fr.



[16] « Lorsqu’un tiers est titulaire de droits de propriété intellectuelle portant sur un document sur lequel figure une information publique, l’administration (…) indique à la personne qui demande à la réutiliser l’identité de la personne physique ou morale titulaire de ces droits, ou, si elle n’est pas connue, l’identité de la personne auprès de laquelle l’information en cause a été obtenue ».



[17] L. N°2006-9621, Journal Officiel 3 Août 2006.



[18] CADA, Avis n°20092706.



[19] « Dans la mesure strictement nécessaire à l'accomplissement d'une mission de service public, le droit d'exploitation d'une œuvre créée par un agent de l'État dans l'exercice de ses fonctions ou d'après les instructions reçues est, dès la création, cédé de plein droit à l'État. Pour l'exploitation commerciale de l'œuvre mentionnée au premier alinéa, l'État ne dispose envers l'agent auteur que d'un droit de préférence. Cette disposition n'est pas applicable dans le cas d'activités de recherche scientifique d'un établissement public à caractère scientifique et technologique ou d'un établissement public à caractère scientifique, culturel et professionnel, lorsque ces activités font l'objet d'un contrat avec une personne morale de droit privé. »



[20] Article 13.



[21] Au titre de l’article 15 de la loi de 1978, la réutilisation des informations publiques peut donner lieu au versement de redevances, plusieurs critères sont retenus par la loi quant à l’évaluation de ces redevances. Doivent être pris en compte :

-          les coûts de mise à disposition des informations (notamment le coût d’un traitement permettant de les rendre anonyme) ;

-          le coût de collecte et de production des informations ;

-          la rémunération raisonnable des investissements de l’administration comprenant le cas échéant une part des droits de propriété intellectuelle.

Par ailleurs, l’administration doit s’assurer que :

-          les redevances sont fixées de manière non discriminatoire ;

-          le produit total ne dépasse pas le total formé d’une part par les coûts de collecte, production et mise à disposition des informations et d’autre part de la rémunération.

Enfin lorsque l’administration utilise des informations publiques a des fins commerciales elle ne peut en facturer la réutilisation aux autres opérateurs à un coût supérieur à celui qu’elle s’impute, ni leur imposer des conditions moins favorables à celles qu’elle s’applique à elle-même.

En l’absence de licence, la réutilisation est libre et gratuite dès lors que les informations entrent dans le champ de la loi.



[22] Avis n°12 du Conseil National du Numérique relatif à l’ouverture des données publiques (« Open data ») du 5 juin 2012.



[23] Voir, CADA, Conseil n°20071418, séance du 5  avril 2007.



[24] Proposition de Directive du parlement européen et du conseil modifiant la directive européenne 2003/98/CE concernant la réutilisation des informations du secteur public.



[25] L’auteur remercie Jeanne Dauzier d’avoir effectué les recherches nécessaires à la rédaction de cet article lorsqu’elle était stagiaire au sein du cabinet Bird&Bird AARPI.