Comprendre la révolution numérique

Accueil > Rubriques > Le gouvernement joue-t-il vraiment le jeu de l’open data ?

Le gouvernement joue-t-il vraiment le jeu de l’open data ?

mardi 10 janvier 2012

Le 5 décembre dernier ouvrait le nouveau portail du gouvernement français : data.gouv.fr. Ce site a pour objectif de mettre à disposition de l’ensemble des citoyens un grand nombre de « jeux de données » issues des différentes administrations françaises. Il est le résultat du travail de la mission Etalab, placée en février 2011 [1] sous l’autorité du Premier Ministre à la suite du rapport Riester [2] publié l’année précédente qui en préconisait la création.

Data.gouv.fr a pour ambition de placer la France dans un mouvement international dit d’« open data » (données ouvertes) déjà mis en oeuvre par plusieurs pays comme les Etats-Unis et le Royaume-Uni. Il propose aujourd’hui 350 000 jeux de données issues pour l’essentiel de l’INSEE (recensement de 2008), mais aussi du Ministère de l’Environnement parmi d’autres, ainsi que de quelques collectivités territoriales. Officiellement, le projet répond à deux objectifs :

− un objectif de transparence de la part de l’Etat et de ses administrations.


"La transparence est un choix" par etalab

− un objectif de développement économique avec la création de nouveaux services commerciaux basés sur l’exploitation des données publiques.


F. Fillon annonce data.gouv.fr par etalab

La condition sine qua non à la réalisation de ces objectifs est la libre réutilisation des données sans condition, en particulier de nature financière. L’accès et l’exploitation y compris commerciale des jeux de données est libre et ne donne pas lieu à redevance ou contre-partie financière. Cette ligne de conduite, qui doit bien convenir aux partisans du libre accès à l’information est surprenante ; en tout cas bien éloignée des moeurs administratives françaises qui ont souvent pratiqué le culte du secret pour l’accès aux données et qui, lorsqu’elles y donnent accès, en interdisent par principe, par culture, toute utilisation dans un cadre qu’elles n’auraient pas défini par avance.


NKM salue l’ouverture de data.gouv.fr par etalab

Pus profondément, cette politique entre en conflit avec les évolutions jusqu’à ces dernières années de certains établissements publics comme l’IGN ou Météo France, lancés dans une activité croissante de commercialisation de leurs données. Politique commerciale basée sur une restriction d’accès aux données ou libre mise à disposition de celles-ci sans espoir de revenus commerciaux que d’autres, des entreprises privées, se chargeront d’exploiter ? Les deux idéologies coexistent au sein de l’Etat, et le discours de Séverin Naudet, maître d’oeuvre de data.gouv.fr , en rend bien compte.


S.Naudet @ Transparence & Open Data par etalab

La mise à disposition des données publiques par Etalab, l’agence gouvernementale chargée de mettre en oeuvre data.gouv.fr, ne se fait pas dans un grand vide sociétal. Des groupes de pression existent depuis maintenant quelque temps, qui cherchent à encourager l’action du gouvernement en la matière. Le journal en ligne Owni en est le meilleur représentant pour ce qui concerne la presse. Théoricien du « journalisme de données », un des anciens membres de l’équipe, Nicolas Kayser-Bril, en fut le fer de lance [3] jusqu’à son départ en juillet dernier. Né dans la foulée de l’appel à projet innovant lancé en 2009 par le secrétariat d’Etat à l’économie numérique, l’entreprise Data Publica, présente un modèle d’affaire qui consiste à traiter les jeux de données pour en fournir des représentations directement exploitables auprès de ses clients. Côté associatif, c’est plutôt Regards Citoyens qui tient le devant de la scène.

L’association a d’ailleurs pris la peine de décortiquer les 350 000 jeux de données annoncées par data.gouv.fr, ce qui lui a permis d’exprimer quelques critiques [4] sur le nombre réel de données mises à disposition et le format sous lequel elles le sont. Concernant leur nombre tout d’abord, l’association fait remarquer à juste titre que la plus grande part des données présentées proviennent du recensement de 2008 effectué par l’INSEE, dont les résultats se déclinent en autant « jeux de données » qu’il y a de communes en France, c’est-à-dire 36000.

Sur le format, l’association relève que la plupart de ces données sont livrées sous forme de fichiers Excel, format fermé et propriétaire propre au logiciel éponyme de Microsoft. Etalab répond non sans raison qu’Excel est le format-roi des administrations françaises. Le problème ne viendrait donc pas de data.gouv.fr mais plutôt des administrations elles-mêmes dont le respect du Référentiel Général d’Interopérabilité est pour le moins inégal.

Et encore, fait-on remarquer dans un autre article [5] : les fichiers Excel au moins présentent des données structurées, exportables et donc exploitables. Il n’en va pas de même avec les fichiers .doc ou, pire, .pdf que l’on trouve aussi dans le portail gouvernemental.

Globalement cependant, la plupart des commentateurs accordent des bons points au gouvernement pour la qualité du travail accompli. Certes, data.gouv.fr n’est au fond qu’un annuaire bien fait de jeux de données publiques qui étaient déjà accessibles, mais son utilité est évidente. La mise à disposition sous licence ouverte en particulier, est bienvenue. On ne peut qu’espérer que la petite équipe dynamique de l’agence Etalab parviendra à entraîner un nombre croissant d’administrations françaises à entrer dans le mouvement.

Toute initiative, aussi positive soit-elle, doit pourtant être remise dans le contexte d’une politique plus générale. Le mouvement open data porte avec lui un risque important : que se spécialisant sur la mise à disposition de certains types de données, quantitatives notamment, et s’intéressant exclusivement à certaines modalités techniques de mise à disposition, par l’intermédiaire de portails et/ou d’api, il en vienne à oublier de s’interroger sur d’autres aspects bien plus importants lorsqu’il s’agit d’évaluer la transparence de l’Etat et de ses administrations : la manière dont les données sont produites et, bien sûr, les données qui ne sont pas accessibles.

Or, la production de statistiques publiques n’a sans doute jamais subi autant de pressions et de manipulations que sous le pouvoir actuel. Que ce soit les menaces à peine voilées sur l’INSEE que l’on a voulu délocaliser [6], l’affaiblissement concerté de l’appareil statistique du Ministère de l’Education nationale [7], les manipulations sur les modes et objets de mesure, sans cesse perturbés afin d’empêcher les comparaisons ou les embargos voire interdictions de publication de certains chiffres, les atteintes au bon fonctionnement de l’appareil statistique public ont été nombreuses ces dernières années. L’ouvrage collectif, Le grand Trucage. Comment le gouvernement manipule les statistiques [8], publié en 2009 aux Editions La Découverte en est un bon témoignage. Un exemple, peut-être anecdotique, mais frappant : le décompte du nombre de voitures incendiées dans la nuit de la Saint-Sylvestre ne fait plus l’objet d’un décompte officiel, au prétexte de ne pas encourager une compétition entre les cités [9].

Peut-être. Mais que dire alors de l’impossibilité à laquelle sont confrontés les sociologues cherchant à travailler sur l’institution policière de pouvoir enquêter au sein des unités de police [10] ? Les longues enquêtes de terrain ne sont sans doute pas présentables sous forme de tableaux Excel additionnant les « faits constatés » (dont on sait combien ils sont difficiles à interpréter) ; elles n’en constituent pas moins des méthodes de collecte de « données » irremplaçables et indispensables à la compréhension fine d’une des institutions publiques qui posent le plus de problème aujourd’hui.

Le mouvement open data court le risque de représenter l’aboutissement extrême du « fétichisme du chiffre » [11] qui structure désormais le débat public. Devenue un élément potentiel de communication politique, la « donnée » doit être l’objet d’une critique plus acérée que celle qui porte sur les formats de fichier : dans quelle condition est-elle fabriquée ? pourquoi est-elle structurée de cette manière ? que mesure-t-elle et que ne mesure-t-elle pas ? comment évolue-t-elle dans le temps ? quelle est la fiabilité, l’indépendance de celui qui la produit ? C’est sur ces pistes que doivent se lancer les collectifs citoyens et les médias spécialisés sur ces questions.

L’opacité la plus efficace est celle qui se donne l’apparence de la transparence.


[1« Décret n° 2011-194 du 21 février 2011 portant création d’une mission «  Etalab  » chargée de la création d’un portail unique interministériel des données publiques », février 22, 2011, http://www.legifrance.gouv.fr/affichTexte.do;jsessionid=?cidTexte=JORFTEXT000023619063

[2Franck Riester, Amélioration de la relation numérique à l’usager (Ministère du Budget, des Comptes publics, de la Fonction publique et de la Réforme de l’état, février 1, 2010). http://www.modernisation.gouv.fr/piliers/simplifier/evenements/le-groupe-experts-numeriques-pilote-par-franck-riester-a-remis-son-rapport-a-eric-woerth-et-nathalie-kosciusko-morizet/telecharger-le-rapport-riester-pdf/index.html

[3Nicolas Kayser-Bril, « Le datajournalisme : vecteur de sens et de profits », OWNI, Digital Journalism, avril 17, 2011, http://owni.fr/2011/04/17/le-datajournalisme-vecteur-de-sens-et-de-profits/.

[4« OpenData  : La moyenne pour un data.gouv.fr sous formats propriétaires », Regards Citoyens, décembre 4, 2011, http://www.regardscitoyens.org/opendata-la-moyenne-pour-un-data-gouv-fr-sous-formats-proprietaires/.

[5Nicolas Patte, « La France entr’ouverte », OWNI, Digital Journalism, décembre 10, 2011, http://owni.fr/2011/12/10/la-france-entrouverte-transparence-open-gov-open-data-etalab/.

[6« La délocalisation de la statistique publique à Metz, un enjeu pour la démocratie », Mediapart, janvier 30, 2009, http://blogs.mediapart.fr/edition/en-defense-de-la-statistique-publique/article/300109/la-delocalisation-de-la-statistiqu.

[7« Des statistiques d’Etat à géométrie variable », Le Monde , décembre 14, 2011, http://www.lemonde.fr/idees/article/2011/12/14/des-statistiques-d-etat-a-geometrie-variable_1618346_3232.html.

[8Guillaume Rollet, « Lorraine Data, Le grand truquage. Comment le gouvernement manipule les statistiques », Lectures, Les comptes rendus (décembre 11, 2009), http://lectures.revues.org/862.

[9Annie Thomas, « Saint-Sylvestre : pas de chiffres de voitures brûlées mais un début de polémique », Google News, janvier 2, 2011, http://www.google.com/hostednews/afp/article/ALeqM5js4Ucq9k9TZwxj7szfMA6OSgEDnA.

[10Alice Géraud, « « Etudier la police est devenu quasi impossible » », liberation.fr, novembre 18, 2011, http://www.liberation.fr/societe/01012372241-etudier-la-police-est-devenu-quasi-impossible.

[11Vittorio De Filippis, « Triche  : la statistique, c’est très pratique », liberation.fr, mai 29, 2009, http://www.liberation.fr/economie/0101570051-triche-la-statistique-c-est-tres-pratique.

Messages

  • Bonsoir,
    à propos de l’IGN, ce que vous indiquez est contraire à la réalité ; en effet, depuis 2010, l’enseignement et la recherche bénéficient de conditions de gratuité sur toutes les données IGN ; depuis début 2011, la gratuité est la règle pour toutes les données du RGE (Photos, données topo, parcellaires et adresses) dans le cadre de missions de service public.

    En 2011, un service de téléchargement gratuit de photos brutes et de cartes a été ouvert ; l’accès gratuit aux données géodésiques, acquis depuis plusieurs années, a été techniquement amélioré.

    Les conditions de réutilisation sont disponibles sur l’espace professionnel du site IGN : http://professionnels.ign.fr/index.do

    En matière de gratuité, on peut aussi mentionner la consultation gratuite du Géoportail : http://wwww.geoportail.fr et la réutilisation (gratuite hors sites explicitement commerciaux) en ligne de ces mêmes fonds au moyen de l’API Géoportail : http://api.ign.fr/geoportail/

    Enfin, on peut mentionner quelques lots de données sous licence ouverte depuis décembre 2012 ; ils ont accompagné l’ouverture de data.gouv : http://professionnels.ign.fr/45/licences-et-tarifs/pour-les-donnees-gratuites.htm

    Finalement, au cours des dernières années, c’est donc la diffusion gratuite de données IGN qui est devenue majoritaire, la diffusion sous licence à titre onéreux demeurant toutefois significative.

    Quant à un prétendu conflit entre l’IGN et ses tutelles, il est possible de revoir présentation et vidéo : http://www.ign.fr/institut/documentArticle.do?idDoc=6433362&indexRoot=4&indexChild=3¤tRootSearch=&indexChildSearch=

    • Bonjour,

      merci de votre message et des précisions que vous apportez. Les évolutions, heureuses, que vous mentionnez, sont apparues assez récemment, au cours des deux dernière années. J’ai corrigé ma formulation en conséquence. Il est à noter que la « licence ouverte » utilisée par data.gouv.fr autorise pour sa part la réutilisation commerciale, ce qui n’est pas le cas de l’api de Géoportail.

      Je suis intéressé à mieux connaître la logique qui a conduit l’IGN à exclure l’exploitation commerciale de l’utilisation libre de ses données ?

      Avec mes remerciements.

    • Bonjour,
      Votre réponse pose en fait trois autres questions, celle de la perception du temps tout d’abord, celle de la gratuité de l’API Géoportail, et enfin la question de l’équilibre budgétaire de l’IGN.

      A l’échelle de mesure traditionnelle du temps chez les cartographes, deux années peuvent sembler courtes ; il fallait autrefois 30 ans pour renouveler la carte d’Etat-major, puis ce qui est devenu la carte au 1 :25000, alors qu’un siècle entier est nécessaire pour renouveler le cadastre (mais il n s’agit pas là que de cartographie).

      En matière de données numériques et de services en ligne, une période de deux ans est au contraire très longue, voit apparaître des mutations majeures (croissance voire généralisation du sans fil, des outils nomades, du cloud computing, apparition ou consolidation de nouveaux géants du web…) ; en cartographie, comme dans d’autres domaines de l’administration, il s’agit donc d’harmoniser ces temporalités différentes, tout en continuant à s’adresser à tous selon les principes du service public ; concrètement il s’agit d’être présent sur le web et de diffuser des données numériques, tout en continuant à imprimer du papier et à le distribuer sous forme traditionnelle. L’IGN n’est qu’un parmi d’autres à affronter ces problèmes mais, pour tous, penser que deux ans est une période courte ne recouvre qu’un aspect des évolutions en cours.

      Pour ce qui est de l’API Géoportail, il ne s’agit pas de données, mais d’un service en ligne appuyé sur des données, les licences s’appliquant aux données n’étant donc pas adaptées. L’API Géoportail a donc une licence spécifique, permettant d’une part de larges possibilités d’utilisation gratuite pour la publication sur des sites web ouverts : https://api.ign.fr/geoportail/presentation.do?presentationSubjectId=6 et d’autre part un ensemble de cas d’utilisations tarifées pour lesquels une clientèle existe déjà.

      Sur la réalité commerciale d’une partie de l’activité de l’IGN, il s’agit d’abord de maintenir un équilibre financier établi depuis longtemps, fait d’une subvention à hauteur d’une grosse moitié et de vente de prestations diverses (travaux, conseil, ventes de cartes, …et vente de licences de données) en complément. Cet équilibre est bien connu et est reconduit annuellement par ses tutelles et son conseil d’administration.

      Il s’agit aussi d’être en prise directe avec un secteur économique et professionnel et d’accompagner ses mutations, ce qui me semble, à l’expérience, et sans doute aussi malgré quelques erreurs, malentendus et péripéties, en fin de compte plutôt positif pour tous.

      Bien cordialement