Séminaire « Open Data, quels enjeux pour la protection des données personnelles ?»
24 pages
Français

Séminaire « Open Data, quels enjeux pour la protection des données personnelles ?»

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
24 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

La Présidente de la CNIL, Isabelle FALQUE-PIERROTIN introduit la journée en soulignant qu’il s’agit d’une étape dans le cadre d’une démarche générale de concertation avec les acteurs de l’Open data, qui se veut la plus ouverte et constructive possible.

Informations

Publié par
Nombre de lectures 44
Licence : En savoir +
Paternité, pas d'utilisation commerciale, partage des conditions initiales à l'identique
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

Séminaire « Open Data, quels enjeux pour la protection des données personnelles ?», 9 juillet 2013Compte rendu Sommaire Introduction..................................................................................................................................................... 1 Rappel du cadre juridique de l’Open data.............................................................................................. 2 Table ronde n° 1 : Données publiques, données personnelles, données anonymes : où est la frontière ?................................................................................................................................................................... 4 Table ronde n° 2 : Données publiques, données personnelles : quelle gouvernance et quels modèles économiques ?......................................................................................................................................... 8 Atelier n° 1 : Comment anonymiser ?..................................................................................................... 11 Atelier n° 2: Quels droits des personnes dans l’Open Data?........................................................ 13 Atelier n° 3: Comment faciliter l’accès des chercheurs aux données publiques?................... 16 Atelier n° 4 : Open data et au-delà…...................................................................................................... 20 Conclusion3....2.................................................................................................................................................. Introduction
-Isabelle FALQUE-PIERROTIN, présidente de la CNIL ; -Henri VERDIER, directeur d’Etalab. La Présidente de la CNIL,IsabelleFALQUE-PIERROTINintroduit la journée en soulignant qu’il s’agit d’une étapedans le cadre d’une démarche générale de concertation avec les acteursde l’Open data, qui se veut la plus ouverte et constructive possible. La CNIL, consciente des bénéfices démocratiques et économiques de l’Open data, y est résolument favorable. Si la CNIL s’intéresse au sujet alors que les données personnelles ne sonta prioripas les premières concernées par l’Open data, c’est essentiellement parce que la frontière entre les différentes catégories de donnéesou publiques; anonymes ou personnelles indirectement identifiantes ; etc.n’est pas toujours claire. Pour construire unOpen datalégitime et durable, il est donc primordial de s’interroger au plan éthique sur la place des données personnelles, de l’anonymisation, du consentement, etc.
1
La réutilisation des données personnelles mises à dispositiondans le cadre de l’OpenDatapose la question de l’articulation des législations sur la protection des données personnelles et sur la réutilisation des informations du secteur public: l’Open datacontribue à garantirle droit d’accès aux informations publiqueset la liberté de réutilisation par tous desdonnées ouvertes … alors que la loi« Informatique»et Libertéss’appuie, elle, sur la finalité d’un traitement de données pour apprécier la proportionnalité de ses caractéristiques (nature des données traitées, durée de conservation, destinataires, …). En réalité, cette question nous invite à repenser globalement la notion de gouvernance 1 publiquedes données. Le directeur d’Etalab,Henri VERDIER, remercie la CNIL d’avoir organisé ce séminaire et d’y avoir associé Etalab. Selonil est nécessaire de sortir de lui, l’idée selon laquelle, à partir d’un certain niveau de transparence, on porterait nécessairement atteinte à la vie privée. Transparence et vie privée ne se situent pas sur un même axe, et ne sont pas en opposition. LOpen dataest un outil demodernisation de l’action publiqueet participe d’un objectif d’intérêt général en démocratie: garantirl’opacité du citoyen et la transparence de l’État, là o les États non démocratiques font l’inverse. Dans une démocratie aboutie, l’État doit rendre des comptes et protéger le citoyen: l’Open datas’érige commel’une des composantes de cette transparence. En réalité, la presque totalité des données gouvernementales qui sont ouvertes n’ont aucun caractère personnel. L’État publiesurtout des cartes, des chiffres bruts et des indicateurs généraux. Cependant, nous entrons dans une période de « révolution de la donnée ». La « mise en 2 données du monde» qui en résulte doit nous conduire à redéfinir nos manières d’agir, à créer des infrastructures cognitives d’un nouveau genre.C’est tout l’intérêt de réflexions, comme celles de cette journée, permettant de clarifier les enjeux réels de la question de l’Open Data et des données personnelles.Rappel du cadre juridique de l’Open data
-Serge DAËL, président de la CADA ; La loi n°78-753 du 17 juillet 1978 modifiée (dite loi CADA) constitue, dans sa version actuelle, le fondement du droit d’accès individuel aux documents administratifs (cf. art. 2 et 6 de la loi « Cada »après occultation des données de vie privée), de l’obligation ou de la possibilité de publier des actes administratifs, dediffuser d’autres documents administratifs (opérations soumises à la fois aux lois CNIL et CADA en présence de données personnelles), ainsi que dudroit de réutilisation des informations publiques à d’autres fins que la mission de service public qui a justifié leur collecte. 1 La mission Etalab est un service du Premier ministre chargé de l'ouverture des données publiquesde l’Etat. Au sein duSecrétariat général pour la modernisation de l’action publique(SGMAP),Etalab coordonne l’action des services étatiques pour faciliter la réutilisation la plus large possible de leurs informations publiques. Etalab administre le portail unique interministériel «data.gouv.fr »destiné à rassembler et à mettre à disposition l’ensemble des informations publiques de l’Etat, de ses établissements publics et, si elles le souhaitent, des collectivités territoriales et des personnes de droit public ou de droit privé chargées d’une mission de service public. 2 Selon la formule utilisée parLe Monde Diplomatiquedans un titre du numéro de juillet 2013.
2
La réutilisation d’informations publiques s’inscrit dans de ce que l’on appelle aujourd’hui l’Open Data(l’ouverture des données), dont l’objet est l’accès libre et gratuit aux inf ationsdu secteur public en vue : De contribuer à des activités privées desdéveloppements réalisés par des opérateurs économiques ; de permettre la transparence du débat public. Parmi les autrestextes qui régissent d’une manière ou d’une autre l’Open data, peuvent être cités : - ladirective 2003/98/CE du 17 novembre 2003 concernant la réutilisation des informations du secteur public (quivient d’être modifiée par la directive 2013/37/CE du 26 juin 2013 dont les dispositions devront être transposées avant le 18 juillet 2015) ; - ladirective 95/46/CE du 24 octobre 1995 sur le traitement des données à caractère personnel ; o - laloi n78-17 du 6 janvier 1978 modifiée dite « Informatique et Libertés » ; - ledécret du 21 février 2011 créant la mission Etalab ; - lacirculaire du 26 mai 2011 relative à la création du portail interministériel des données publiques ; - etle Code pénal, en particulier le chapitre VI du titre II du livre II. La notion de « données publiques» est une notion propre à l’économie numérique et à une philosophie de la gouvernance issue de l’Open data. Cette notionn’existe pas en droit positif, qui ne connaît que les notions de « données à caractère personnel » et « informations publiques » (contenues dans un document dont la communication constitue un droit). Les textes relatifs à la mission Etalab comportentd’une part,des dispositions impératives à propos des informations publiques de l’État et de ses établissements publics (sauf en matière d’enseignement, de recherche et de culture), d’autre part,des dispositions incitatives sur les informations publiques des collectivités territoriales et des autres personnes de droit public. La législation sur la réutilisation des informations publiques crée plusieurs obligations à la rgedes administrations : La signature d’une licence n’est pas obligatoire, sauf en cas de paiement d’une redevance. Elle n’en est pas moins très souhaitablene serait-ce que pour assurer l’information duréutilisateur. En principe, aucune exclusivité ne doit être accordée, à moins qu’elle ne soit nécessaire à l’exercice d’une mission de service public.La gratuité n’est pas exigée par la loi, même si celle-ci la permet. En ce qui concerne les catégories d’informations del’État et de ses établissements publics administratifs, une redevance peut être calculéeconformément aux dispositions de l’article 15 de la loi du 17 juillet 1978, sous réserve d’en justifier l’existence et de l’inscrire sur une liste er fixée par décret (pour les redevances instituées avant le 1juillet 2011, la liste a été publiée). Certaines données personnelles (par exemple concernant des agents publics) directement identifiantes font l’objet de publicité légale (exemple des arrêtés de nomination, les
3
promotions, distinctions honorifiques, etc.) et de ce fait ne bénéficient pas du même niveau de protectionen cequi concerne l’accès et la publication.
Aux termes de l’article 13 de la loi CADA, les informations publiques comportant des données personnelles peuvent être réutilisées, soit si la personne concernée y a consenti, soit si elles ont été rendues anonymes ou, à défaut, si une disposition législative ou réglementaire le permet. La question de l'anonymisation des données mêle des enjeux économiques et de libertés publiques. Plusieurs questions se posent : -Jusqu’à quand faut-il parler d’identification indirecte? - Quidoit anonymiser les données? A la lecture des dispositions de la loi « Cada », l’opération ne devrait pas être assurée par le réutilisateur, mais par l’administration détentrice des données ou ses sous-traitants. - Quidoit assumer la charge financière des opérations d’anonymisation? -Comment procéder à l’anonymisation? Cette question est délicate car il ne s’agit pas seulement de rayer les nom et prénom.-Quelle est l’efficacité réelle des mesures d'anonymisation adoptées? À cet égard, seule l’anonyartisanale »,au cas par cas, semblemisation manuelle, « aujourd’huiopérationnelle, faute d’outils techniques performants.- Quiest habilité à procéder au recueil préalable du consentement de la personne concernée en cas de réutilisation de données non anonymisées ? Il ne faut pas se faire d’illusion: l’anonymisation des données ne résoudra pas la totalité des problèmes d’identification: les données ainsi expurgées peuvent souvent redevenir indirectement identifiantes, pour peu qu’on les rapproche d’autres sources d’informations.♦♦♦
Table ronde n° 1 : Données publiques, données personnelles, données anonymes : où est la frontière ?
-Simon Chignard, consultant,conférencier et auteur de « L’Open data, comprendre l’ouverture des données publiques » ; -Michel Isnard, chef de l’unité des affaires juridiques et contentieuses à l’INSEE; -Jérémie Valentin, chef de Projet Open data de la Ville de Montpellier ; -Claire Gallon, cofondatrice et administratrice de Liber’TIC. L’objectif de latable rondeest d’abord de tenter de mieux cerner les contours des notions clés de données personnelles et d’anonymat et de s’entendre sur le champ couvert par les données personnelles incluses dans les informations publiques susceptibles de faire l’objet de communication, de mise à disposition sur une plateformeOpen Dataet de réutilisation: Quelles sont les donnéespersonnelles susceptibles d’être concernées par l’Open data? Qu’entend-on par données personnelles? Par données anonymes? Comment anonymiser les données ? Sophie VULLIET-TAVERNIER, directrice des études, de l’innovation et de la prospective (DEIP) de la CNIL et animatrice de cette table ronde, rappelle en préambule, en quoi la CNIL est concernée par l’Open Data: la notion de donnée à caractère personnel est largement définie dans la directive de 1995 et dans la loi du 6 janvier 1978 modifiée (article
4
2); de plus, la CNIL applique cette définition en considérant la nature et le nombre des données, l’importance de l’échantillon,les caractéristiques du traitement, etc. (cf. annexe 1 : Présentation). Elle donne ensuite la parole à Simon CHIGNARD , consultant et auteur deL’Open Data: comprendre l’ouverture des données publiques, en lui demandant si, à son sens et au vu de son expérience et des préoccupations quotidiennes des collectivités locales engagées dans l’Open Data , la problématique des données personnelles constitue aujourd’hui un frein ou est susceptible de constituer un frein à l’ouverture des données publiques? S’il n’existe pas de définition de ce qu’est une «donnée ouverte », la donnée personnelle et la vie privée en tracent une frontière naturelle, qui n’en est pas moins floue. Pour illustrer la problématique,Simon CHIGNARDcitel’exemple du fichier des prénoms donnés dans l’année aux nouveau-nésd’une commune. Ce fichier, vendu par l’INSEE au niveau national, est « ouvert » sur le portail Open Data de plusieurs municipalités. Cependant, sur certains sites de collectivités locales, certains prénoms «rares »n’y figurent pasen-deçà d’un seuil(5, 6 ou 10 occurrences minimales pour un prénom), lequelvarie d’unecommune à l’autre sans raison apparente, et sans que l’on sache vraiment l’origine de cette règle (certaines municipalités invoquant la CNIL). Cette pratiquen’est: passans conséquence selon Simon Chignard, de 40 % à 60 % des prénoms ne figurent pas dans ces fichiers,d’o le manque de fiabilité et donc d’intérêt de ces bases de données, et ce alors même que les risques d’atteinte à la vie privée résultant de la diffusion de ce type dedonnées ne semblent pas, en première approche, très élevés. L’intervenant s’appuie sur cet exemple pour mettre en évidencel’attentede règles et de recommandations pratiques, notamment de la part de la CNIL. Simon CHIGNARD faitpar ailleurs remarquer que,dans l’Open data, la valeur n’est pas dans la donnée mais dans la réutilisation qui en sera faite. Or, Ces réutilisations sont souvent impossibles à anticiperd’o la question du respect effectif du principe de finalité.Il relève que le caractère personnel des informations publiques est souvent mis en avant ou invoqué pour justifier le refus de les communiquer ou de les mettre à disposition en Open Data, ce qui restreint la liberté de réutilisation. Aussi souhaite-t-il que le débat ne se limite pas aux cas sensibles (archives, données de santé, décisions de justice, etc.)et qu’il permette de déboucher sur des conseils pratiques à l’intention des administrations, collectivités territoriales et réutilisateurs afin de leur permettre de déterminer en pleine connaissance de cause si les bases de données dont la mise à disposition est envisagée comportent ou non un risque réel de réidentification des personnes et d’impact sur leur vie privée. Michel ISNARD, chef de l’unité des affaires juridiques et contentieuses de l’INSEE, rappelle le principe du secret statistique de l’article 6 de laloi n°51-711 du 7 juin 1951, avant de présenter les trois modalités de diffusion d’informations auxquelles l’INSEEa recours (cf nexe2 : Présentation) : des données agrégées, diffusées sous forme de tableaux ; des données individualisées mais anonymes, excluant tout élément permettant une identification, même indirecte (cf. fichiers « Grand Public » et fichiers de Production et de Recherche, destinés aux chercheurs) ; des données individuelles «confidentielles »incluant des éléments permettant l’identificationdirecte ou indirecte des personnes concernées, qui ne peuvent être diffusées que sous certaines conditions, notamment après examen du projet par le
5
comité du secret statistique (dont fait partie la CNIL). L’accès aux données de ce type, réservé aux chercheurs, s’effectue à partir duCentre d’accès sécurisé distant (CASD)géré par le Groupe des Écoles nationales d’économie et statistique (GENES).L’INSEE peut refuser de transmettre les données s’ilestime que celles-ci sont couvertes par le secret statistique. La loi « Cada » ne vise certes pas expressément le secret statistique, pour autant les notions de secret industriel et commercial, de secret fiscal et, de façon plus générale, de respect dû à la vie privée reprennent les intérêts définissant le secret statistique. Michel ISNARD exposeun cas pratique pour illustrer les difficultés de la diffusion des données anonymisées de l’INSEE: les statistiques sur les revenus des habitants. Il évoque la technique du «carroyage des données») qui consiste à découper le territoire national en carreaux de 200 mètres de côté et à localiser les données dans ces carreaux afin de donner une certaine stabilité dans le temps à leurs modalités de diffusion et permettre de comparer «l’évolution d’un même carreau». Cette méthode est surtout utilisée pour les données fiscales. L’idée de départ était de donner aux géographes une idée du capital géographique (données sociodémographiques ou niveau de revenus de la population par carreau). Or, du fait de l’inégale répartition de la population sur le territoire, un carreau sur deux est vide et un bon nombre d’autres carreaux sont trop peu peuplés pour garantir l’anonymat des données. Après recoupement avec un autre fichier, épousant par exemple les limites administratives des communes, il devient possible d’identifier la situation de certaines personnes. L’évolution des limites territoriales de certaines communes doit également être prise en considération. Ce dispositif de carroyagen’étant actuellementplus satisfaisant, la CNIL va être saisiede cette difficulté pour laquelle l’INSEE a envisagé plusieurs pistes de solution. Jérémie VALENTIN, chef de projetOpen datala ville de Montpellier, souligne que pour jusqu’à présent laquestion des données personnelles n’aune préoccupationpas constitué majeure. En effet, sur plus d’une centaine de jeux de données disponibles, seule une dizaine concerne peu ou prou des données personnelles. ’a été confronté à cette question qu’à 3 reprises: les données qui se rapportent à des agents de la collectivité ; les quelques données qui concernent des citoyens, telles que les données des permis de construire (numéros de dossiers, nom d’architecte, nom et prénom du propriétaire), dont il conviendrait, selon lui,d’éviter qu’elles ne soient utilisées par 3 des promoteurs;
3 [cfhttp://www.cada.fr/urbanisme,6227.html] la Cada a rappelé que «constituait undocument communicableà une entreprise la liste despermis de construired’une commune[contenant des données personnelles : cote archives du dossier, numéro de permis, nom et prénom du bénéficiaire, lieu de construction, mentions sur la nature de la construction, année du permis]mais que sa réutilisationdes fins commerciales devait satisfaire aux exigences du à chapitre II de la loi du 17 juillet 1978 ainsi qu’aux dispositionsde la loi du 6 janvier 197820073182).Dans le cas d’un registre des autorisations d’occupation des sols, qui contient des données à caractère personnel [numéro d’enregistrement de la demande, dates de dépôt et date d’affichage de celle-ci, nature des travaux, nom et adresse du demandeur, adresse du terrain, référence cadastrale et superficie, nature de la décision, numéro d’affichage, dates de commencement et d’achèvement des travaux, conformité et éventuelles informations],elle a rappelé qu’il appartient à l’administration de mettre en garde la société ayant sollicité la communication sur les obligations qui lui incombent en vertu du chapitre II de la loi du 17 juillet 1978 et de la loi du 6 janvier 1978, notamment son article 36, qui subordonne la réalisation d’un traitement de données à caractère personnel à des fins commerciales à l’accord exprès de la personne concernée ou à l’autorisation préalable de la CNIL»20080010).
6
les données relatives aux membres d’associations, qui supposent le recueil préalable du consentement des personnes concernées. S’agissant des permis de construire, il est demandé si le fait qu’ils soientaccessibles pour une certaine finalité, affichés sur le terrain à titre de publicité légale ou communicables à tout demandeur pour sa parfaite information,donne le droit d’en permettre la mise à disposition pour une toute autre finalité. Force est de reconnaître qu’aujourd’hui, les procédés d’anonymisation des fichiers utilisés sont artisanaux : la suppression de certains champs se fait manuellement, au cas par cas, au risque de laisser passer des données identifiantes (par exemple des metadonnées). Un besoin de conseils pratiques se fait ressentir là aussi. Une autre question se posera prochainement à propos de la publication des statistiques annuelles sur les mariages: les informations publiées pourront-elles intégrer sans risque des informations concernant le sexe des mariés ? De manière générale, le CIL (Correspondant Informatique et Libertés) n’est actuellement pas associé officiellement aux projetsOpen data; ce qui n’interdit pas qu’il puisse être ponctuellement consulté. Jérémie VALENTINpropose que les personnes en charge de l’Open data puissent bénéficier d’une journée de sensibilisation à la CNIL et puissent demander un audit par la CNIL des catégories de données concernées. Claire GALLON, cofondatrice et administratrice de l’association Liber’TIC, clôture cette première table ronde. LiberTICse donne pour mission d’encourager la réutilisation des données ouvertes mises à disposition sur les plateformesOpen data. Il y a trois ans, aucune donnée personnelle ne se trouvaitparmi ces données. Aujourd’hui, quelques jeux de données contiennent des données personnelles, notamment par recoupement avec des données récupérées sur d’autres sources que les portailsOpen Data. Claire Gallon souligne le fait que les réseaux sociaux disposent de données bien plus précises et riches que celles mises à disposition sur les plateformesd’Open Data. Le principal frein au développement de l’Open data vienten réalité desproducteurs d’informations publiques et de recherche, qui manquent de règles précises. Elle insiste sur le fait que l’anonymisation entraîne toujours une perte d’informations. Or, le manque de finesse des données est un frein à leur réutilisation. En conclusion, Claire GALLONune anonymisation en amont des données pour permettre leur préconise réutilisation « paisible et légale ». cours des débats organisés avec la salle, il est précisé que : un des principes voulus pasl’Open dataest d’excluredéclaration / formalité toute préalable d’usage (à l’exception justement des données personnelles dont la réutilisation est soumise aux dispositions de la loi informatique et libertés) et toute discrimination entre les réutilisateurs ; toutes les informations du secteur public relèventin finede la propriété de l’Etat, quelque soit leur détenteur ; l’appréciation desmesures d’anonymisation àeffectuer dépend aussi des données qui sont accessibles par ailleurs, par le producteur de données ou toute autre personne (article 2 de la loi IL) ; le groupe européen des autorités de protection des données (dit le G29) travaille actuellement sur un avis, à paraître en fin d’année,relatif aux modalités d’anonymisation;
7
des statisticiens réfléchissent actuellement au niveau européen à denouvelles méthodes d’anonymisation sur la base de scénarios d’intrusion.Gaëtan GORCE, sénateur et membre de la CNIL, déclare ne pas être hostile à l’Open data, mais rappelle que le droit au secret est un des principes de la démocratie. C’est pourquoi il estime que chaquecollectivité devrait au préalable mesurer l’impactpossible sur la vie privée de la diffusion de toute nouvelle donnée publique susceptible, dans leur réutilisation, de permettre une réidentification des personnes. Il souhaiterait également que la responsabilité du réutilisateur puisse être engagée en cas de violation des règles applicables. Benjamin OOGHE-TABANOU, cofondateur du collectif Regards citoyens, demande, à propos des données carroyées, s’il ne pourraitpas être envisagé qu’ellespuissent être le cas échéant agrégées là ou un risque de réidentification est constaté. Michel ISNARDrépond que l’INSEE réfléchit à une telle approche. Il ajoute cependant que cette solution pourrait toutefois ôter tout intérêt à la base, la valeur ajoutée du carroyage étant de fournir une donnée géographique sur un espace constant dans le temps. Un agent de la CNIL rappelle que le projet de règlement européen, en son considérant 23 (comme le considérant 26 de la directive de 1995), indiquequ’«il y a lieu d'appliquer les principes de protection à toute information concernant une personne identifiée ou identifiable. Pour déterminer si une personne est identifiable, il convient de considérer l'ensemble des moyens susceptibles d'êtreraisonnablementmis en œuvre, soit par le responsable du traitement, soit par une autre personne, pour identifier ladite personne. Il n'y a pas lieu d'appliquer les principes de protection aux données qui ont étérendues suffisamment anonymesque la personne pour concernée ne soit plus identifiableet la dernière phrase neraisonnablement »». Le terme « figurent pas dans la loi « Informatique et Libertés » modifiée en 2004. ♦♦♦ Table ronde n° 2 : Données publiques, données personnelles : quelle gouvernance et quels modèles économiques ?
-Mohammed Adnene Trojette, auditeur à la Cour des Comptes ; -Thomas Saint-aubin, responsable du pôle de la stratégie à la Direction de l’Information Légale et Administrative ; -Benjamin Ooghe-Tabanou, cofondateur du collectif Regards citoyens ; -Charles Népote, chef de projet « Partage des données publiques » à la FING ; -Jean-Marc Lazard, directeur et cofondateur d’OpenDataSoft; -François Bancilhon, directeur de Datapublica. Romain LACOMBE, chargé d’innovation et de développement à Etalab, anime la table ronde. Il précise en préambule que la table ronde a pour objet de réfléchir sur le cadre juridique de la réutilisation des données, la responsabilité des réutilisateurs, les outils susceptibles de maîtriser les risques pour la vie privée (modalitésd’accès aux données, contenu des licences, etc.), ainsi que la portée du consentement à la réutilisation de ses données. Quel cadre pour la réutilisation des données? Quelle responsabilité pour les réutilisateurs ? Quels outils pour maîtriser l’impact «» (modalités pratiques pour accéder auxvie privée
8
données, contenu des licences, …)? Le consentement à la réutilisation de ses données : vraie ou fausse garantie? Comment le recueillir? Quelle valorisation pour l’Etat, des données qu’il détient? Mohammed AdnèneTROJETTE, auditeur à la Cour des comptes, a été chargé par le Premier ministre d'une mission sur l'ouverture des données publiques (Open Data) et les 4 redevances de réutilisation (le rapport devrait être rendu cet été 2013). Interrogé sur la valorisation possible pour l’Etat des données publiques il souligne qu’actuellement il n’existe pasvraimentd’étude disponible sur ce que peut rapporter le marché de l’Open 5 Data .Il regrette l’absence d’informations synthétiques sur les données ouvertes, les cas dans lesquels des redevances sont dues, ainsi que sur les conditions de réutilisation fixées dans les licences.La mission qu’il effectue montre que l’instauration des redevances est souvent motivée par des difficultés budgétaires des administrations et par les réticences de celles-ci à diffuser leurs données. A cet égard,la protection des données aujourd’hui constitue souvent un alibi pour ne pas fournir les données mais les progrès techniques en matière d’anonymisationconstituent une vraie opportunité économique pour promouvoir l’ouverture des données.Thomas SAINT-AUBIN, responsable du pôle stratégie à la Direction de l’Information Légale et Administrative (DILA), intervenant en son nom personnel, évoque les différentes catégories juridiques qui existent en matière de données, que ce soient les lois CADA et CNIL ou cellesen matière de droit d’auteur. Ces contextes différents montrent qu’il est possible de challenger les logiques binaires « vie privée / transparence », en jouant sur la granularité de l’ouverture et les licences. Dans ce cas, il faudrait inventer des systèmes de licences différenciées sur les données personnelles qui permettent d’indiquer clairement ce qu’on autorise et n’autorise pas en termes de réutilisation. Le système pourrait alors s’inspirer de celui existant pour le droit d’auteur avec les licencesCreative Commons: on peut imaginer despolitiques d’accès, de diffusion et de réutilisation de ses données personnelles, avec des déclinaisons selon que ces données sont disponibles en stock (permettant le téléchargement des données) ou en flux (permettant l’utilisation via une API), et que ces données soient nominatives ou non, pseudonymisées, anonymisées… Thomas SAINT-AUBIN imagineainsi un système emboité de diverses catégories de «Licences d’Informations Publiques» Un tel référentiel de permissions et de contraintes serait une manière innovante de penser la relation entre la personne et les données la concernant. Tout comme certains ont ainsi imaginé des licences « copyleft » en opposition au « copyright » on pourrait imaginer un concept de «privacyleft »,permettant à la personne de revenir sur les permissions accordées si le réutilisateur ne respecte pas les contraintes. Pour conserver le modèle français de droit à la vie privée face à la vision anglo-saxonne de laprivacy, il faut en tout cas selon Thomas SAINT-AUBIN combinernouveaux outils juridiques et nouveaux outils techniques: l’usage d’uneinterface de programmation applicative (API) par le ministère de la justice lors des alertes enlèvements permet ainsi, en conservant la maîtrise des données diffusées, de garantirle droit à l’oubli. 4 Le rapport devrait être prochainement rendu public (http://simplification.modernisation.gouv.fr/mesure/publier-un-rapport-sur-le-modele-economique-des-redevances-dutilisation-des-donnees-publiques/?public=&thematique=ouverture-des-donnees)
9
Benjamin OOGHE-TABANOU, cofondateur du collectif Regards Citoyens, travaille depuis 4 ans sur la mise à disposition des données de la vie politique (cf.www.nosdéputés.fr et www.nossénateurs.fr) afin de faciliter un contrôle et un dialogue citoyen. Il se dit à la fois engagé dans le numérique et militant du respect de la vie privée. Malgré son attachement à la CNIL, il reste perplexe face à ses récentes prises de position qui peuvent donner à penser que la Commission s’érige« contre la transparence de la vie publique ». Il craint en effet que le respect des données personnelles ne soit instrumentalisé par certains pour s’opposer à la diffusion des informations publiques et faire obstacle à la transparence de la vie publique. 6 Il cite l’exemple de l’avis rendu dans le cadre des projets de»décret dits « Sunshine Act par lequel la CNIL propose des mesures techniquesrestreignant l’indexation sur les données personnelles, ce qui empêcherait tout traitement en masse des données et interdirait de mettre au jour des liens existant entre groupes pharmaceutiques et médecins. Les citoyens pourraient uniquement accéder aux données concernantun médecin déterminé. Cette solution empêcherait ainsi la transparence recherchée pourtant
données publiques et réutilisables. Est présentée la démarche entreprise par Regards Citoyens pour obtenir la liste des personnes auditionnées par l’Assemblée nationale entre 2007 et 2010 à partir de l’exploitation des listes de personnes auditionnées annexées àcertains des rapports officiels publics des députés. Les «citoyens »ont pu compléter ces listes en précisant les noms et activités des personnes auditionnées (par une démarche collaborative d’enrichissement des données dite «crowdsourcing »). L’objectif decette étude de Regards Citoyens et Transparency International Franceétait de mesurer la place des groupes de pression parmi les personnes auditionnées. Il regretted’avoir eu des difficultés pour obtenir une réponse claire de la CNIL sur la possibilité de mettre en ligne ces données. Trois courriers de la CNIL ont été reçus par l'association : l'un demandant l'anonymisation (septembre 2010), l'autre évoquant un problème d'interprétation de la loi CADA (février 2011) et un troisième rédigé 7 un an après la publication de l'étude. Dansle doute,l’ensemble a été anonymisé, seule l’identité des structures pour lesquelles les personnes auditionnées travaillent est accessible. Benjamin OOGHE-TABANOUestime qu’au-delà de l’Open data qui,par définition, ne concerne pas les données personnelles, il serait préférable que la CNIL consacre plutôt ses
6  Décretdu 21 mai 2013 relatif à la transparence des avantages accordés par les entreprises produisant ou commercialisant des produits à finalités sanitaire et cosmétique destinés à l’Homme; dans sonavis sur le texte, la CNIL, afinde concilier l’objectif de transparence voulu par le législateur et la protection des données personnelles prévues par la loi du 6janvier 1978,demandé que soient protégées du référencement par tout moteur de a recherche externe les données identifiantes déposées sur le site internet. Cette position a été interprétée comme empêchant désormais de mener des études ciblées sur le réseau d’influence detel ou tel laboratoire. 7 Cf. correspondances de la CNIL du 20 septembre 2010, de février 2011 et du 3 janvier 2012
10
séminaires sur leBig Datadont les impacts sur la vie privée sont en revanche avérés et plus inquiétants jour après jour. Charles NEPOTE, chef du projet « Partage des données publiques » à la FING, estime que le développement de l’Open data nedoit pas être compris comme uniquement lié à des 8 opportunités économiques. Son objectif est plutôt la sérendipitéet donc le « dé-contrôle » en amont sur les réutilisations : il fautaccepter d’être surpris par les usages qui seront faits des données.C’est pour cela que l’Open datas’accommode si mal des notions de finalité définie. Globalement, Charles Népote considère que nous assistons en fait à un mouvement croissant d’« autonomisation» des données. À cet égard, il regrette l’absence des acteurs du crowdsourcing. Il se dit également surpris que les acteurs publics ne parlent pas davantage d’éthique des donnéeset évoque l’exemple du conseil général de Saône et Loire qui a créé uncomité d’éthique sur les questions d’Open data. Jean-Marc LAZARD,directeur et cofondateur d’OpenDataSoft, décrit le processus que suivent les acteurs publics dans leur démarche d’Open dataet le rôle que joue son entreprise dans leur accompagnement. Selon les cas, les acteurs publics cherchent en effet des solutions «clés en main» ou bien souhaitent développer eux-mêmes des solutions techniques et des plateformes. Globalement, ces projets imposent aux acteurs publics de mener une réflexion sur le patrimoine informationnel et sur la gouvernance des données. Selon lui, un aspect positif de l'Open datadoit pas être négligé: il pousse les acteurs ne publicsà s’interroger surla qualité de la donnée dont ils disposent. François BANCILHON, directeur de Datapublica, estime qu’il faut dépasser le rôle d’épouvantail que certains font jouer à la CNIL. Le problème principal vient de ce que le principe de finalité apparait contradictoire et, en tout état de cause, est fortement remis en question,avec la mécanique de l’Open data. Cependant, il ne faut pas se focaliser sur ces aspects difficiles. Avant toute chose, il reste de nombreuses informations publiques dépourvues de donnée à caractère personnel et qui ne sont toujours pas accessibles (ex. la carte scolaire). Pour autant, là où le problème existe, François Bancilhon estime que les règles de protection des données doivent concerner les usages plutôt que les données. ♦♦♦L’après-midi était organisé autour de 4 ateliers ayant lieu en parallèle. Les participants à la journée étaient libres d’assister et de participer à n’importe lequel de ces ateliers, et ceux-ci étaient entièrement dédiés à l’échange et au débat entre les participants, à partir d’une animation générale par des agents de la CNIL et des experts invités. Les éléments de compte-rendu sont essentiellement issus des notes prises par les animateurs et par les participants eux-mêmes, sur un outil de prise de note collaboratif en ligne mis en place pour l’occasion. Ils ne sont donc pas exhaustifs.
Atelier n° 1 : Comment anonymiser ?
Atelier animé par Gwendal Le Grand, chef du service de l’expertise informatique à la CNIL
8 Néologisme, signifiant “Fait de faire une découverte par hasard et par sagacité, souvent alors que l’oncherchait autre chose »http://fr.wiktionary.org/wiki/s%C3%A9rendipit%C3%A9
11
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents