Le centre d'accès sécurisé aux données de la statistique publique française : un nouvel outil pour les chercheurs

De
Publié par

En 2010, l'Insee a mis en place un nouveau dispositif d'accès aux fichiers individuels de la statistique publique, essentiellement à destination des chercheurs : le CASD, « centre d'accès sécurisé distant ». Rendu possible par l'évolution récente de la loi de 1951 sur le secret en matière de statistiques, il permet d'accéder à des données individuelles selon une procédure très réglementée. Cet article en donne une présentation générale.
Publié le : dimanche 30 décembre 2012
Lecture(s) : 17
Nombre de pages : 5
Voir plus Voir moins

Le centre d’accès sécurisé aux données
de la statistique publique française :
un nouvel outil pour les chercheurs
Jean-Pierre Le Gléau * et Jean-François Royer **
En 2010, l’Insee a mis en place un nouveau dispositif d’accès aux fichiers individuels de la
statistique publique, essentiellement à destination des chercheurs : le CASD, « centre d’ac-
cès sécurisé distant ». Rendu possible par l’évolution récente de la loi de 1951 sur le secret en
matière de statistiques, il permet d’accéder à des données individuelles selon une procédure
très réglementée. Cet article en donne une présentation générale.
a protection de la confiden- pression pour que ces désagrégations c’est-à-dire en pratique des données
tialité des données recueillies soient de plus en plus fines est allée sur des entreprises ou des établisse-L à des fins d’établissement de en croissant au fil des années, au fur et ments - la loi de 1951 a dès l’origine
statistiques est un des principes ma- à mesure du progrès des techniques et prévu la possibilité de dérogations
jeurs de la statistique publique. Dès des outils d’analyse statistique dans au secret statistique. Depuis 1984,
1951, la loi organisant la statistique de nombreux secteurs de la société. de telles dérogations sont possibles
1
publique en France comprenait le Or, au-delà d’un certain niveau de sous réserve d’un passage devant un
mot « secret » dans son titre. Dans le détail dans les croisements, le secret comité spécialisé rattaché au
code de bonnes pratiques de la statis- statistique ne peut plus être respecté, Conseil national de l’information
tique européenne publié en 2005, le car les « cases de tableaux » révèlent statistique (Cnis), le comité du secret
secret statistique figure au principe en fait des informations individuelles. sta. Celui-ci examine le
2
n° 5 . Il convient en effet de pouvoir Cette contradiction est devenue parti- bien-fondé de la demande, évalue la
assurer aux personnes répondant à culièrement apparente dans les nécessité d’avoir recours à des infor-
une enquête que leurs réponses ne travaux des chercheurs. La commu- mations individuelles, juge le
pourront en aucun cas être utilisées nauté des chercheurs en sciences sérieux du demandeur et la capacité
de façon à leur porter préjudice. humaines et sociales a depuis long- de l’organisme auquel il appartient
C’est pourquoi la préservation du se- temps fait valoir son besoin d’accéder et qui soutient sa demande à respec-
cret statistique constitue une disposi- à des informations individuelles pour ter en pratique les contraintes liées
tion majeure de la loi fondamentale effectuer des travaux de plus en plus au respect du secret statistique. En
de la statistique française. complexes. Ces travaux ne nécessi- cas d’avis positif, le demandeur peut
Pendant longtemps cette exigence tent pas, en général, de connaître avoir accès aux données, après
n’a pas été ressentie comme une forte nommément la personne ayant signature individuelle par chaque
gêne par les utilisateurs de la statis- répondu à l’enquête. Mais les cher- bénéficiaire d’un engagement à
tique publique. Ceux-ci se conten- cheurs ne peuvent plus se contenter respecter les règles du secret statis-
taient de résultats globaux des de disposer de résultats agrégés. Le tique. Il faut souligner que cette
enquêtes ou de résultats désagrégés développement de la théorie et des possibilité, qui en pratique bénéficie
selon des catégories prédéfinies (acti- outils économétriques, conjugué à à des équipes de recherche et à des
vités, professions, lieux) sans que la celui de la puissance des instruments administrations publiques, ne leur est
diffusion de ces résultats porte de calcul ouvre de multiples possibi- pas réservée par la loi.
atteinte au secret. Cependant, la lités fondées sur l’analyse de données
individuelles, que les chercheurs sont Dans le cas des « données relatives
impatients d’explorer. aux faits et comportements d’ordre
* Chef du département de la coordination statistique à
privé» - c’est-à-dire en pratique desl’Insee
** Chercheur au Crest-Insee Accès à des données données sur des personnes ou des
1. Loi n° 51-711 du 7 juin 1951 sur l’obligation, la co- individuelles : la situation ménages - la loi de 1951 ne prévoyait
ordination et le secret en matière de statistiques
entre 1951 et 2008 à l’origine aucune dérogation et,2. « Le respect de la vie privée ou du secret des affaires
des fournisseurs de données (ménages, entreprises, ad- jusqu’en 2008, aucune communica-
ministrations et autres répondants), la confidentialité des Dans le cas de renseignements indivi- tion de renseignements individuels
informations qu’ils communiquent et l’utilisation de cel-
duels relatifs à des « données à carac- n’était possible. Seule la communica-les-ci à des fins strictement statistiques doivent être ab-
solument garantis ». tère économique et financier » - tion de fichiers anonymisés était licite.
Courrier des statistiques n° 130, mai 2011 1Le centre d'accès sécurisé aux données de la statistique publique française
Pour répondre à la demande de plus secret statistique, dont la compétence Le recours à un centre
en plus pressante des chercheurs, a donc été étendue. d’accès sécurisé
l’Insee a créé en 2006 les « fichiers de
production et de recherche » (FPR), La procédure suppose, après l’avis du Depuis 2008, la loi rend donc
fichiers individuels, présentant une comité du secret statistique, l’accord possible la communication de
observation par individu enquêté, du service dont émanent les docu- données statistiques sur les personnes
mais où l’on a au préalable supprimé ments avant la décision formelle de ou les ménages à des chercheurs.
toutes les variables permettant l’identi- communication par la direction des Mais l’impératif de protection des
fication directe ou indirecte des archives. Pour ce qui le concerne, répondants continue à s’imposer à
personnes : nom, adresse, profession l’Insee a informé le comité du secret tous, et particulièrement aux institu-
et nationalité détaillées, identification statistique, lors de sa séance du tions statistiques. C’est pourquoi
de l’employeur pour les salariés, etc. 6 octobre 2009, des conditions qu’il l’Insee a choisi de recourir à un
Ces FPR sont mis à la disposition des mettrait pour donner cet accord : « centre d’accès sécurisé » pour
chercheurs via le réseau Quetelet, mettre en œuvre les nouvelles dispo-
avec lequel l’Insee a signé une - pour les services statistiques minis- sitions permises par la loi.
convention précisant les modalités de tériels (SSM), qui ont dans leur
mise en œuvre du dispositif. Cette mission de gérer des dossiers couverts Qu’est-ce qu’un centre d’accès sécu-
disposition a permis de satisfaire un par le secret statistique, les fichiers risé ? C’est un dispositif technique
grand nombre de demandes des cher- seront transmis sous réserve de la permettant à des utilisateurs autorisés
cheurs pour l’accès à des données production par eux d’un document de travailler sur des données confi-
individuelles, et elle reste d’une attestant qu’ils se sont bien dotés des dentielles tout en s’assurant que ces
grande utilité. moyens pour faire respecter le secret données ne risquent pas d’être
statistique et que leur équipement détournées pour d’autres fins, acci-
Cependant, il existe un ensemble de informatique présente bien l’étan- dentellement ou intentionnellement.
demandes, légitimes du point de vue chéité suffisante par rapport à celui En matière de données statistiques, la
scientifique, qui ne peuvent trouver du reste du ministère ; création des premiers centres d’accès
leur satisfaction dans la mise à dispo- sécurisés destinés à la recherche
- pour les autres demandeurs, l’accès
sition des FPR. Ce sont les projets de remonte aux années 1990 aux USA et
aux données se fera par le biais d’un
recherche qui nécessitent un détail au Canada. En Europe, des pays du
centre d’accès sécurisé ;
géographique, par nationalité ou par Nord (Danemark, Pays-Bas) ont créé
profession non disponible dans les - dans ces deux cas, les fichiers auront de tels centres au début des années
3
FPR , ou qui font appel à un apparie- été, si nécessaire, transformés pour 2000. Ils ont été rejoints par la
ment avec d’autres fichiers, par perdre leur caractère directement Grande-Bretagne, puis l’Allemagne,
6
exemple en couplant, grâce à l’identi- nominatif ; c’est-à-dire qu’on y aura au milieu de cette décennie .
fiant de l’employeur, des caractéristi- retiré, le cas échéant, le nom du
ques de l’enquêté et de l’entreprise répondant et le NIR (numéro d’ins- Les premiers centres d’accès sécuri-
dans laquelle il travaille. L’accès à ces cription au répertoire - le numéro de sés à des données statistiques ont été
informations rompt nécessairement la Sécurité sociale) ; des centres « physiques »,
l’anonymat et était, de ce fait, impos- c’est-à-dire des locaux gérés par
- pour les demandes d’accès à des
sible jusqu’en 2008. une institution statistique (éventuel-
documents directement nominatifs,
lement à l’intérieur d’une universi-
l’accord ne pourrait être donné que
té, comme au Canada) et contenant
dans le cas de la constitution d’un
Les évolutions issues de un serveur de données. Dans ces
échantillon pour une enquête de la
la loi de 2008 concernant locaux, l’institution statistique
statistique publique ayant obtenu unles données sur les ménages donne au demandeur un accès5
visa sous réserve de l’accord expli-
physique directement sur le serveur.
cite, au cas par cas, du comité de
En 2008, la modification de la loi Cela implique que le demandeur se
direction de l’Insee.
statistique de 1951 par un article de la déplace pour travailler en dehors de
4
loi sur les archives a ouvert la possi- son environnement habituel. Cette
bilité d’accéder à des renseignements solution exige aussi l’aménagement
3. Afin de rendre les FPR totalement anonymes, certai-
individuels relatifs aux faits et de locaux spécifiques (éventuelle-nes variables géographiques, sur la nationalité ou la
profession sont supprimées (code commune) ou re-comportements d’ordre privé sous ment en plusieurs points du terri-
groupées en un petit nombre de modalités.deux conditions : toire) matériellement sécurisés
4. Loi n°2008-696 du 15 juillet 2008 relative aux ar-
chives, article 2 (portes, fenêtres) dont la surveil-
- l’une liée à la finalité : cette commu-
5. Ce visa est attribué par le ministre chargé de lance est confiée à une personne
nication n’est possible qu’à des fins l’économie et le ministre à la compétence duquel res-
assermentée. C’est la solutionsortissent les intéressés.de statistique publique ou de
6. Pour un panorama, on pourra consulter dans le retenue au Canada et en Allemagne.
recherche scientifique ou historique ; Courrier des statistiques n°121-122 de décembre Elle est très coûteuse, aussi bien
2007 : « L’accès aux micro-données et la gestion de la
- l’autre liée à la procédure : celle-ci pour l’Institut de statistique queconfidentialité dans quelques INS européens » par
Dominique Rouault.exige en effet un avis du comité du pour les chercheurs.
2 Courrier des statistiques n° 130, mai 2011Jean-Pierre le Gléau et Jean-François Royer
Grâce aux progrès de l’informatique, d’économie et statistique, établisse- chercheur qui estime qu’il ne peut
on a vu apparaître depuis 2005 des ment public qui était jusqu’à fin 2010 pas s’en contenter et qu’il a besoin
« centres d’accès sécurisés distants » une direction de l’Insee). Elle consiste des fichiers complets doit à ce stade
(CASD) n’imposant plus aux cher- à mettre à disposition de l’organisme bien préciser pourquoi certaines
cheurs de se déplacer dans un endroit demandeur, un terminal appelé « SD variables lui manquent encore :
particulier. Ce sont des systèmes Box » pour lui permettre de se c’est l’information cruciale qu’il
informatiques dans lesquels les connecter et de travailler sur le devra fournir au comité du secret
données restent stockées sur un serveur installé au Genes. Cette « SD statistique. Pour cette phase d’éla-
serveur unique, géré par l’institution Box » permet au chercheur de voir boration, le chercheur devra impé-
statistique, mais sur lequel les cher- les données sur lesquelles il travaille, rativement prendre contact avec le
cheurs peuvent travailler à distance, de les intégrer dans ses calculs et d’en service producteur, de façon à bien
sans risque de dissémination. Il peut tirer des tableaux, graphiques, analy- cerner sa demande et à vérifier qu’il
s’agir seulement de pouvoir ses. Mais à aucun moment il ne peut a pris connaissance de tous les
soumettre des travaux à distance ni les imprimer, ni les enregistrer sur fichiers auxquels il peut avoir
(« remote submission »), les résultats un support quelconque : clef USB, accès, de leurs possibilités et aussi
étant récupérés de façon différée ; ou CD Rom... Ainsi, les données ne quit- de leurs limites.
bien il peut s’agir d’un véritable accès tent jamais le serveur du Genes. La
« en ligne » (« remote access ») communication entre cette Le chercheur présente ensuite sa
permettant au chercheur une forte « SD Box » et le serveur est assurée demande au comité du secret statis-
interactivité avec les données. Dans par une liaison sécurisée et cryptée. tique : le secrétariat du comité
ce dernier cas, le chercheur distant (comite-secret@cnis.fr) peut lui fournir
travaille réellement « sur le serveur » Cette solution a commencé à fonc- toutes les indications nécessaires. Le
de l’institution statistique, mais le tionner début 2010, et à ce jour une comité du secret statistique se réunit
logiciel de sécurisation des données trentaine de projets de recherche en une fois par trimestre et donne un avis ;
l’empêche de les exporter. bénéficient. Les deux paragraphes qui il opère comme cela a été décrit précé-
suivent décrivent plus en détail le demment pour les données sur les
cheminement d’un projet de entreprises. S’ajoutent cependant,
La solution retenue recherche qui a recours à ce dispositif. dans les critères à prendre en compte,
par l’Insee ceux de la finalité du traitement qui ne
peut être, pour les données sur les
Phase préparatoire : connaître
Pour les demandeurs autres que les ménages, que la statistique publique
les données, explorer
SSM, l’Insee a donc choisi la solution du ou la recherche scientifique ou histo-les moyens d’accès, faire
passage par un centre d’accès sécurisé rique. La présence du chercheur à lales formalités administratives
distant en « remote access », où les séance du comité est nécessaire pour
données, les métadonnées et les Concrètement, un chercheur qui que ses membres puissent recevoir les
programmes d’utilisation restent donc souhaite accéder à des données indi- éclaircissements et les assurances
sur un serveur central unique géré par viduelles sur les ménages produites nécessaires.
l’institution statistique ou sous son par l’Insee ou par un SSM doit tout
contrôle. Techniquement, cette solution d’abord prendre connaissance de la En cas d’avis favorable du comité du
aurait pu être mise en œuvre en instal- source statistique dont ces données secret statistique, le chercheur peut
lant un logiciel gérant la confidentialité peuvent être tirées, et des différents consulter les données sur le centre
(interdisant entre autres toute recopie ou produits de diffusion de cette source. d’accès sécurisé distant. Un certain
impression des données examinées) sur Pour cela, ce chercheur dispose de délai est cependant nécessaire pour
chaque poste de demandeur. C’est la deux ressources documentaires prin- d’une part mettre en place les
solution retenue aux Pays-Bas. Elle cipales : le site Internet de l’Insee données que le chercheur est autorisé
implique une adaptation de ce logiciel à (www.insee.fr) (ou celui du SSM), à traiter, d’autre part accomplir les
chaque configuration des ordinateurs ; riche en informations générales sur la formalités requises par la Commis-
elle doit être modifiée lorsque cette source, en données agrégées et qui sion nationale de l’informatique et
configuration change. met à disposition un fichier individuel des libertés (Cnil).
anonymisé d’usage public s’il a été
La solution retenue par l’Insee possible d’en établir un ; le site Inter- Les données disponibles sur le CASD
présente les mêmes fonctionnalités, net du réseau Quetelet sont aujourd’hui celles auxquelles
mais a l’avantage de n’impliquer (www.reseau-quetelet.cnrs.fr) qui donne accès le comité du secret
aucune intervention dans le système donne accès à un dessin de fichier, et statistique, dans sa formation « ména-
informatique des établissements de au « FPR » s’il en existe un. ges ». Il s’agit donc d’enquêtes statis-
recherche. Elle a été mise au point et tiques auprès des ménages, récentes
brevetée par l’équipe « Organisation Beaucoup de recherches, on l’a dit, ou plus anciennes, y compris le
du système d’information » du Genes peuvent être conduites avec ces recensement de la population. Mais il
(Groupe des écoles nationales matériaux d’accès aisé et rapide. Le s’agit aussi de données
Courrier des statistiques n° 130, mai 2011 3Le centre d'accès sécurisé aux données de la statistique publique française
administratives déjà mises à la dispo- Phase active : la formation, une « boîte aux lettres » virtuelle à
sition de l’Insee ou des SSM au titre de et le travail sur le CASD laquelle il a accès. Ce fichier est
bis 7
l’article 7 de la loi de 1951 . À titre examiné par des personnes habilitées
Dans les semaines qui suivent sond’exemple, les déclarations annuel- au secret statistique. Elles s’assurent
autorisation à accéder à certainesles de données sociales (DADS) figu- que le fichier ne contient pas d’élé-
données confidentielles, le chercheurrent dans cette catégorie. D’autres ments pouvant constituer une rupture
est invité par les gestionnaires dudonnées peuvent également être du secret statistique. Si tel est le cas,
CASD à participer à une séance diteintroduites dans l’espace réservé au elles avertissent le chercheur et lui
« d’enrôlement », au cours deprojet du chercheur sur le CASD, si demandent de rectifier son fichier de
laquelle lui sont rappelés les princi-leur utilisation est nécessaire dans le sortie, afin qu’il soit conforme aux
pes généraux du secret statistique, lacadre de l’étude pour laquelle il a règles de la confidentialité. S’il ne
responsabilité personnelle qui luidemandé l’accès aux informations comporte aucun élément de nature à
sera confiée et les modalités pratiquesconfidentielles. Il peut s’agir par dévoiler une information confiden-
d’accès au centre. Ces dernièresexemple de données apportées par le tielle, il est renvoyé, par simple
consistent en :chercheur lui-même ; elles sont alors messagerie, au chercheur.
introduites sur le CASD par un agent
- l’attribution d’une « SD Box », si
habilité à la gestion du centre. Aujourd’hui, cette vérification est
l’organisme dont il dépend n’en est
exhaustive sur tous les fichiers de
pas encore pourvue ;
Comme on l’a vu plus haut, avant de résultats produits dans le CASD dont
- l’attribution d’une carte individuellese connecter, le chercheur doit égale- un chercheur demande la sortie. C’est
de connexion contenant un codement avoir accompli les formalités une solution coûteuse, car elle
obtenu par traitement de ses emprein-nécessaires auprès de la Cnil : en demande une grande expertise de la
tes digitales, relevées au cours degénéral une simple déclaration (pour part des personnes habilitées. Son
cette séance.les fichiers ne comportant pas de coût augmentera avec celui de la
données sensibles), exceptionnelle- fréquentation du centre. Si le nombre
Le chercheur peut avoir accès auxment, une demande d’autorisation. de personnes habilitées qui se consa-
fichiers qu’il a demandés, sur la « SDDe son côté, l’Insee effectue progres- crent à ce contrôle était insuffisant,
Box » qui lui a été attribuée. La recon-sivement toutes les formalités auprès cela pourrait de plus entraîner des
naissance de son identité se fait grâcede la Cnil pour déclarer cette retards dans le feu vert donné aux
à sa carte et à la reconnaissance denouvelle forme de diffusion de chercheurs. C’est pourquoi on pour-
ses empreintes digitales par le lecteurdonnées à caractère personnel. Il rait envisager à l’avenir de n’effectuer
intégré à la SD Box. Il faut noter ques’agit de modifier toutes les déclara- cette vérification que par sondage.
ce dispositif ne comporte aucun stoc-tions (ou demandes d’autorisation) Dans tous les cas, la responsabilité de
kage des empreintes digitales ailleurseffectuées par l’Insee pour les sources la rupture du secret statistique reste
que sur la carte qui reste en posses-statistiques depuis la création de la de la responsabilité de celui qui aurait
sion du chercheur.Cnil (1978). Ce processus est long et produit le fichier fautif. L’absence
plusieurs mois seront encore néces- d’un contrôle exhaustif pourrait
Plusieurs chercheurs peuvent êtresaires avant que toutes les sources mettre en avant ce point et rappeler le
inscrits sur un même projet : le dossierconcernées aient été traitées. Il se chercheur à sa responsabilité person-
présenté au comité du secret statis-peut donc que l’accès à certains nelle, alors qu’un contrôle exhaustif
tique mentionne en ce cas les nomsfichiers soit temporairement retardé, peut lui donner l’illusion (fausse) qu’il
de tous les chercheurs associés à cele temps que ces formalités se fassent. est « couvert » par la vérification
projet. Ceux-ci ont alors accès à unPour diminuer au maximum l’impact effectuée par un tiers.
espace spécifique sur le CASD, dédiésur les utilisateurs du CASD, l’Insee
à leur projet. Le gestionnaire ducommence évidemment en priorité Lorsque le chercheur a mené ses
centre y installe les bases de donnéespar les fichiers les plus demandés sur travaux jusqu’au bout, ce qui doit
qui leur sont spécifiques, et leur ouvrecelui-ci. intervenir avant l’expiration de son
l’accès aux fichiers de l’Insee ou des habilitation, il en avertit les
SSM pour lesquels l’autorisation d’ac- gestionnaires du CASD. Son accès
cès leur a été donnée. Personne au CASD est alors coupé. Cepen-
d’autre qu’eux n’a accès à cet espace. dant, son espace de travail est
Ils peuvent également utiliser la large archivé pour une durée de trois ans
gamme de logiciels de calcul statis- renouvelable une fois. Cette dispo-
tique et d’édition mis à la disposition sition rend possibles les éventuels
7. « Sur demande du ministre chargé de l’économie, de tous les chercheurs sur le CASD. « retours vers les données », néces-
après avis du Conseil national de l’information statis- saires après une publication par
tique, et sauf disposition législative contraire, les in-
Lorsque le chercheur a terminé un exemple. Au terme de cetteformations (...) recueillies dans le cadre de sa
mission, par (...) une personne morale de droit public travail sur les données, il crée un période, tous les fichiers propres au
(...) sont cédées, à des fins exclusives d’établissement fichier de résultats (tableaux, projet chercheur et présents sur le CASD
de statistiques, à l’Insee ou aux services statistiques
de publication,...) qu’il glisse dans seront détruits.ministériels. »
4 Courrier des statistiques n° 130, mai 2011Jean-Pierre le Gléau et Jean-François Royer
Vers une collaboration accrue Le cas des appariements individuelles sur les entreprises.
entre chercheurs et statisticiens Lorsqu’un chercheur a aujourd’hui
accès à ces données, suite à un avisLes chercheurs ont fréquemment
L’accès à des données individuelles de du comité du secret statistique, ilbesoin d’effectuer des appariements
sources statistiques pour mener des obtient ces données sur un CD cryptéde données, pour enrichir les informa-
recherches est une nécessité pour la qu’il doit conserver pendant untions recueillies lors d’une enquête,
plupart des chercheurs contempo- temps dans des conditions de sécuri-par des données administratives, ou
rains. Un premier résultat des progrès té garantissant la confidentialité desissues d’une autre enquête. Cet appa-
récents pour faciliter cet accès - FPR, données, puis détruire. On conçoitriement se fait souvent sur un numéro
CASD - doit être une plus grande facilement que le CASD apporterad’identification (par exemple le NIR
présence et visibilité des données fran- des garanties plus solides de ce pointpour les personnes physiques et le
çaises dans des recherches de niveau de vue.numéro Sirène pour les personnes
international, qu’elles soient menées morales). Dans certains cas, le cher-
par des chercheurs français ou par des En 2010, l’accès au CASD était gratuit.cheur pourra mener lui-même cet
chercheurs étrangers habilités. Il faut En effet certains aspects liés à la miseappariement à l’intérieur du CASD.
préciser en effet que ni la loi, ni la en route (disponibilité des fichiers,Dans d’autres cas, ce ne sera pas
pratique administrative n’interdisent déclaration à la Cnil,...) ont parfoispossible, en particulier si c’est le NIR
la communication de ces données à retardé la mise en œuvre du servicequi est en jeu. Ce numéro, on l’a vu,
des chercheurs étrangers : ceux-ci pour les chercheurs, et il aurait puest retiré, s’il existait dans le fichier
peuvent parfaitement s’engager dans paraître anormal de facturer un serviceinitial, au moment de la mise sur le
le processus de demande décrit plus qui n’avait pas encore atteint la qualitéCASD. Si un appariement non faisable
haut. Et le système informatique voulue. Il est clair cependant que,dans le CASD est cependant néces-
permet d’installer des « SD Box » en au-delà de l’investissement initial, lesaire, et est autorisé par la Cnil, le cher-
tout lieu. Cependant, l’autorisation ne fonctionnement du CASD représentecheur peut demander à l’Insee de
pourra être donnée que si les cher- une charge pour l’institution qui en aréaliser cet appariement hors du
cheurs concernés donnent toutes les la gestion : gestion des demandes,CASD et de mettre le fichier issu de
garanties nécessaires, y compris sur le récupération des fichiers, parfoisl’appariement (sans les numéros
plan juridique, en ce qui concerne la anciens, documentation, mise end’identification) sur le CASD. Il s’agit
sanction des ruptures éventuelles du ligne, formalités Cnil, attributionlà bien évidemment d’une prestation
secret statistique. d’une « SD Box », licences pour lesspécifique, qui ne peut se faire qu’a-
logiciels, vérification des sorties, etc. Àvec l’accord du gestionnaire du CASD
Un deuxième résultat de ces progrès l’avenir, l’accès au CASD devra doncet moyennant une facturation du
sera une intensification de la colla- couvrir les frais entraînés par ces acti-service. Le fichier apparié restera sur le
boration entre statisticiens publics vités. À ce jour, ni les modalités, ni leCASD, sans possibilité pour le cher-
et chercheurs autour des sources niveau de cette tarification n’ontcheur de le sortir, ni d’en tirer des
statistiques. Déjà, des formations encore été complètement définis.résultats qui ne respecteraient pas les
« sources » sont organisées à l’Insee règles du secret statistique. Ce travail
pour les chercheurs bénéficiaires Le CASD a été créé à l’Insee, au seinpeut aussi bien être effectué sur des
des autorisations : elles sont l’occa- du Genes, qui en était une compo-fichiers disponibles sur le centre, qu’a-
er
sion d’échanges fructueux. Certai- sante. Depuis le 1 janvier 2011, levec un ou des fichiers apportés par le
nes difficultés rencontrées par les Genes est devenu un établissementchercheur, comme résultats d’une
chercheurs en cours de travail public d’enseignement supérieur et deenquête qu’il a lui-même effectuée.
devront être résolues en faisant recherche, distinct de l’Insee. En ce
appel aux producteurs, ce qui qui concerne le CASD, cela a entraî-
L’avenir du CASDdevrait enrichir la documenta- né le transfert au Genes de tâches
tion...et dans certains cas permettre incombant auparavant à l’Insee :
de corriger des erreurs. Au fur et à Aujourd’hui, les capacités du CASD habilitation des gestionnaires, trans-
mesure que des recherches utilisant sont encore contraintes par les limites fert des fichiers, opérations de vérifica-
des données individuelles se en matériel et en personnel qualifié tion en sortie, etc. Le Genes définira,
termineront, on attend des cher- nécessaire à son fonctionnement. en son sein, une structure spécifique
cheurs des « retours sur les sources » : Après une inévitable période de de gouvernance pour le CASD. Ces
appréciations, critiques, suggestions, rodage, on pourra envisager d’élargir modifications d’ordre administratif
etc. Comme beaucoup de ces sources encore les missions qui lui sont attri- n’ont pas eu de conséquences sur l’ac-
sont renouvelées périodiquement, ce buées, par exemple en se reposant sur cès au CASD par les chercheurs, pour
processus peut contribuer fortement à lui également pour la mise à disposi- lesquels cette évolution a été « trans-
leur amélioration progressive. tion de fichiers de données parente ».
Courrier des statistiques n° 130, mai 2011 5

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.