Les Sciences sociales et leurs données : rapport au ministre de l'éducation nationale et de la technologie

De
Présentation d'éléments de comparaison sur la situation dans quelques grands pays européens concernant la production, l'archivage et la diffusion des enquêtes auprès de la communauté académique. Puis analyse des évolutions à court et moyen termes qui risquent de peser sur la production et la diffusion des données (protection des données individuelles, évolution des moyens informatiques, construction et harmonisation européenne). Ensuite état des lieux sur les questions relatives aux enjeux et aux difficultés de la production de données en sciences sociales en France, puis proposition pour établir le cadre d'une collaboration entre le CNRS, les universités et l'Insee permettant d'améliorer et d'accroître la diffusion des données pour les sciences sociales et d'associer plus directement la recherche à la production et à l'amélioration des données.
Source : http://www.ladocumentationfrancaise.fr/rapports-publics/004000935-les-sciences-sociales-et-leurs-donnees-rapport-au-ministre-de-l-education-nationale
Licence : En savoir +
Paternité, pas d'utilisation commerciale, partage des conditions initiales à l'identique
Nombre de pages : 180
Voir plus Voir moins

Rapport Silberman
Les sciences sociales et leurs données
© Ministère de l’éducation nationale, de la recherche et de la technologie Juin 1999TABLE DES MATIÈRES
Avertissement ................................................................................................................................3
La lettre de mission ........................................................................................................... ............5
I. Les grands enjeux ...........7
II. L’institutionnalisation du partage des données.....................................................................26
III. Les principes d’une mise en œuvre du partage des données dans le contexte fr ......ança50is
IV. Propositions ...........................................................................................................................74
Conclusions..................................................................................................................................84Les sciences sociales et leurs données
Avertissement
Ce rapport, qui fait suite à la mission qui m’a été confiée par Monsieur Claude Allègre,
Ministre de l’Éducation Nationale, de la Recherche et de la Technologie, s’inscrit dans le
cadre du travail entrepris il y a une vingtaine d’années au Centre d’Études Sociologiques par
le Département d’Analyse Secondaire, et poursuivi avec la création du Lasmas par Alain
Degenne. En gérant pour le CNRS une convention avec l’Insee, signée pour la première fois
en 1986, ce laboratoire a commencé à organiser un cadre de diffusion aux chercheurs des
enquêtes issues de la statistique publique. La réflexion présentée dans ce rapport et les
propositions qui y sont faites n’auraient pu exister sans le travail accumulé depuis au sein de
ce laboratoire et les relations construites avec l’Insee en tout premier lieu, mais aussi dans
d’autres lieux de la statistique publique, le Céreq et la Darés notamment.
Ce travail a cependant trouvé aujourd’hui ses limites. Des quelques enquêtes engrangées au
départ, le fonds actuellement disponible est passé à plus d’une centaine d’enquêtes dont
plusieurs recensements. Des difficultés au départ peu sensibles ont pris progressivement de
l’importance. La diffusion est pour l’instant restreinte aux seuls laboratoires duCNRS alors
que la demande des universitaires s’accroît. D’autres apparaissent, liées en particulier à
l’inquiétude grandissante sur la protection de la vie privée, menacée par la puissance sans
cesse accrue des outils informatiques. L’accès des chercheurs aux données infra communales
du Recensement est devenu de ce fait problématique. Résoudre ces difficultés demande un
cadre et une organisation différente, des moyens plus importants qui doivent être inscrits
maintenant au niveau d’une politique de recherche nationale. La France est en retard sur ce
point de plus de vingt ans sur plusieurs de ses voisins européens qui ont construit, à l’image
de ce qui avait été entamé aux États Unis, de puissan Datts a Archives pour la recherche en
sciences sociales. Elle est également absente des grandes enquêtes européennes et
internationales universitaires.
Il m’a paru indispensable d’associer à cette réflexion le cidsp bdsp, qui à l’initiative de
Frédéric Bon, quelques années avant le Lasmas, a entrepris des efforts analogues dans le
champ de la sociologie politique, archivant et diffusant des données issues des enquêtes
universitaires, plus fréquentes dans ce domaine, et celles de certains instituts de sondage.
Construire un instrument de diffusion des grandes enquêtes, véritable télescope pour les
sciences sociales, n’aurait guère de sens si l’on n’englobait pas d’emblée un champ très large.
Bruno Cautrès, directeur du cidsp bdsp a donc été associé dès le départ au petit groupe
constitué par Alain Degenne, directeur du Lasmas de 1986 à 1998, Annick Kieffer, Ingénieur
de recherche au Lasmas et moi-même, pour piloter cette mission. Dans cette tâche, j’ai
bénéficié de la collaboration et du soutien de nombreux organismes de la statistique publique.
Mes remerciements vont particulièrement à Alain Godinot et Michel Glaude de l’Insee. Ils
vont aussi à Hugues Bertrand et Philippe Méhaut du Céreq, à Claude Seibel de la Darés, qui
le premier avait permis la signature d’une conventioCNRSn -Insee. Partout la mission a reçu
un accueil favorable et a pu recueillir un état précis de la situation ainsi que deuggess s tions
précieuses.
La mobilisation des milieux de la recherche a également été très forte. Les réponses à des
questionnaires pourtant longs ont été nombreuses, qu’il s’agisse des Instituts de recherche ou
3des laboratoires du CNRS et des Universités, témoignant de l’intérêt porté par les chercheurs à
cette mission. Irène Fournier, Marie Odile Lebeaux et Alexandre Kych ont eu la lourde tâche
d’organiser cette enquête et d’en rendre compte.
Jacques Lautman, Bruno Cautrès, Alain Degenne, Alain Chenu, Michel Forsé ont présidé et
rapporté sur les groupes de travail.
Denise Lievesley, Simon Musgrave, Repke De Vries, Margaret Adams, Paul Bernard ont
apporté leur expérience de l’archivage et de la diffusion des données au Royaume Uni, aux
Pays-Bas, en Allemagne, aux États Unis et au Canada.
Bruno Péquignot et Richard Topol pour lCNRSe et Antoine Lyon-Caen pour la Direction de
la recherche ont suivi le déroulement de cette mission.
Je dois une mention particulière à Annick Kieffer qui a apporté toute sa connaissance des
Data Archives à l’étranger, à Isabelle de Lamberterie et à son équipe pour l’aide apportée sur
les questions juridiques, à René Padieu pour ses éclairages incisifs sur ce point et sa relecture
sans concession du rapport, à Jacques Lautman qui m’a soutenue dès le départ dans cette
mission, à Benoît Riandey, organisateur à l’Ined du séminaire de Méthodologie d’enquêtes, à
Marie Odile Lebeaux et Jocelyne Léger qui ont assuré la finalisation de ce rapport. Alain
Degenne a contribué tout au long de la direction du Lasmas pendant 12 ans à faire mûrir la
réflexion. Enfin cette mission n’aurait pu être organisée sans le concours constant de Michèle
Amiot.
Très nombreux ont été tous les autres qui m’ont apporté leur aide. On en trouvera la liste
plus loin. Ils témoignent du consensus très fort qui s’est dégagé autour de cette mission, sur
les principes comme sur les modes d’organisation nécessaires pour mieux réguler le rapport
des chercheurs en sciences sociales à leurs données.
Roxane Silberman
4Les sciences sociales et leurs données
La lettre de mission
Le Ministre
Paris, le 14 janvier 1999
Madame la directrice,
La France produit de nombreuses grandes enquêtes intéressant les sciences
sociales. Cependant cette production s’est développée essentiellement au
sein du monde administratif, de façon extérieure à la recherche et à
l’université ou dans quelques grands instituts, fortement liés à
l’administration. A la différence de l’étranger, tant le CNRS que les
Universités n’y ont que très rarement été directement associés, en partie
faute d’investissement financier.
Toutes les disciplines en ressentent les conséquences. En sociologie
l’enquête exploratoire de terrain est ainsi restée le domaine privilégié des
chercheurs. En même temps la France accuse un assez net retard en matière
de sociologie quantitative, tant sur ses voisins européens que par rapport au
monde anglo-saxon. En économie, les travaux de conjoncture souffrent par
exemple des délais d’accès aux données. D’une manière générale, les
chercheurs et les enseignants ont accédé lentement et difficilement aux
données.
La mission assignée par lCNRSe au Lasmas (upr 320) en 1986 a contribué à
faire évoluer la situation, en permettant, à travers des conventions, d’acheter
des enquêtes avec droit de diffusion à l’ensemble des laboratoires du CNRS.
Des collaborations entre chercheurs et producteurs de données se sont
également amorcées et ont contribué à faire évoluer certaines enquêtes.
La circulation des données de même que la participation directe des
chercheurs à la production de ces données demeurent cependant
insuffisantes. Leur diffusion aux laboratoires universitaires, leur utilisation
pour la formation à la recherche, leur circulation entre instituts producteurs
eux-mêmes ont rencontré des obstacles institutionnels, juridiques et
financiers. Dans le même temps les contraintes de coût tendent à remettre en
cause la production même de certaines enquêtes, souvent les plus proches
des besoins de la recherche.
Le développement des recherches fondées sur des comparaisons
internationales, la construction européenne qui accélère ces travaux de
comparaison et d’harmonisation sont un nouveau défi qui rend d’autant plus
urgent un rapprochement des instituts de recherches, des universités et des
instituts producteurs de données. La question de la circulation des données,
dans le cadre de collaborations européennes ou internationales, est d’ores et
déjà à l’ordre du jour.
5Après avoir :
• donné quelques éléments de comparaison sur la situation dans
quelques grands pays européens concernant la production,
l’archivage et la diffusion des enquêtes auprès de la communauté
académique,
• tracé les évolutions à court et moyen terme qui risquent de peser
tant sur la production que sur la diffusion des données
(protection des données individuelles, évolutions des moyens
informatiques, construction et harmonisation européenne).
Vous devrez :
• faire un état des lieux en France et identifier les principales
difficultés,
• proposer, en sondant les partenaires possibles, le cadre d’une
collaboration entre le CNRS, les Universités et l’Insee en
particulier, permettant d’améliorer et d’accroître la diffusion des
données pour les sciences sociales et d’associer plus directement
la recherche à la production et l’amélioration des données.
Pour mener à bien cette mission vous bénéficierez du concours des diverses
directions du Ministère de l’Éducation nationale, de la Recherche et de la
Technologie concernées par le thème de cette mission, en particulier la
Direction de la Programmation et du Développement et la Direction de la
Recherche.
Je souhaiterais obtenir ce rapport au plus tard à la fin du mois de mai 1999.
En vous remerciant, je vous prie de croire, Madame la directrice, à
l’expression de ma considération distinguée.
Claude Allègre
Madame Roxane Silberman
Directrice du LASMAS-IRESCO
59, rue Pouchet
75849 Paris cedex 17
s/c de Madame Catherine Brechignac
Directrice générale du CNRS
6I. Les grands enjeux
I.1. Changement social et expertise
Les sociétés occidentales connaissent des mutations profondes. Pour laAccompagnant la
croissance rapide de France elles prennent place dans le cadre de l’intégration européenne.
la demande Face à ces mutations, la demande d’expertise a crû et tout laisse penser
d’expertise aux qu’elle s’accroîtra encore. Cette demande d’expertise est naturellement
sciences sociales, la celle des instances gouvernementales et gestionnaires. Mais elle est aussi
production de celle des citoyens et en cela fondatrice de la démocratie. Le passage à
données s’est une société de l’information et du savoir rend plus vive que par le passé
considérablement
cette demande d’expertise qui s’adresse très directement aux sciences
développée.
sociales. Celles ci se trouvent ainsi dans la situation paradoxale d’être de
plus en plus sollicitées dans le même temps qu’elles se trouvent parfois
contestées tant sur leur rigueur que sur leur capacité de cumulativité.
C’est par exemple le cas de la sociologie.
Les données pouvant permettre de fonder une expertise sont aujourd’hui
très nombreuses. On a assisté depuis la fin de la seconde guerre mondiale
à une véritable explosion de leur collecte, qu’il s’agisse des enquêtes
diligentées par l’État et ses services, par les chercheurs ou par les
instituts de sondage, des enregistrements liés à l’administration ou de
ceux que génère l’activité économique. Parce qu’elle a permis de stocker
plus facilement des informations (sous condition d’assurer une veille
informatique) et parce qu’elle a ouvert des possibilités de traitements
rapides et complexes sur des fichiers de taille importante, la révolution
informatique a fait croître de façon exponentielle ces données qui
constituent aujourd’hui de véritables gisements. On est ainsi passé de la
part des utilisateurs, et notamment des chercheurs, d’une demande de
données agrégées en grande partie publiées ou de tableaux à façon, à une
1
demande d’accès aux fichiers primaires de micro-données qui ouvrent
des possibilités nouvelles et bien plus grandes de traitements. C’est plus
particulièrement de ces données qu’il sera question dans ce rapport,
même si les problèmes qui se posent à leur propos peuvent être énoncés
dans des termes assez proches pour d’autres ensembles de données.
Parmi ceux-ci, ceux qu’utilisent par exemple l’histoire ou l’archéologie
pour les sciences sociales, l’épidémiologie pour les sciences de la vie, ont
donné lieu à des débats, des procédures, voire des institutions qui
peuvent alimenter la réflexion. D’autres, comme la

1
. Données non agrégées, concernant les unités statistiques de base de l’échantillonnquêt e é, en
général des individus ou des ménages.I. Les grands enjeux
question des données issues d’entretiens, très utilisés par les sciences
sociales, commencent à faire l’objet d’attention à l’étranger.
Gérer et exploiter au mieux ces gisements sont les problèmes des
prochaines décennies. Ceci pose à la fois des questions d’organisation (il
faut conserver), d’expertise scientifique (on ne peut tout garder) mais
aussi des questions juridiques (propriété intellectuelle, protection de la
vie privée) qui ont pris aujourd’hui, du fait de la révolution informatique,
un relief particulier. Dans ces questions de régulation des gisements de
données, la recherche pose des problèmes spécifiques qu’il importe de
traiter si l’on veut que les sciences sociales soient à même à la fois de
produire en tant que sciences et de répondre à la demande d’expertise
sociale que le citoyen, les politiques et les corps sociaux sont en droit
d’attendre d’elles. Ces deux questions sont distinctes mais liées.
I.2. Les sciences sociales et leurs données
Dans le domaine de Si l’on compare les sciences de l’homme et de la société à d’autres
l’archivage et de la disciplines, plus anciennement constituées et plus fortement orientées sur
mise à disposition l’analyse empirique, on constate immédiatement une particularité des
pour la recherche en premières : les sciences de l’homme et de la société sont avant tout des
sciences sociales, la sciences d’observation et l’expérimentation au sens strict n’est que
France est très en rarement possible pour elles. Cette particularité est parfois partagée avec
retard par rapport à
d’autres sciences, l’astronomie par exemple. Elle conditionne néanmoins
la Grande-Bretagne,
fortement et sous de multiples aspects le travail de recherche en sciences
aux États Unis et à
sociales : la méthode expérimentale des chercheurs de ces disciplines est
l’Allemagne.
constituée de procédures de recueil d’observations et de leur analyse.
Ces procédures ne trouvent sens que par leur réplication dans le temps
ou l’espace. L’accumulation des observations et leur cumulativité
constituent pour les chercheurs en sciences sociales des formes de
contrôle expérimental.
Disposer d’observations recueillies dans des cadres de recherches,
2stocker ces observations en vue d’analyses y compris secondai,r c’es est-
à dire par d’autres, contrôler de manière rigoureuse les procédures de
production et de stockage des données, représentent des conditions sine
qua non pour que les recherches en sciences sociales puissent articuler,
au même titre que les autres sciences, théorie et objectivation. La
production, la disponibilité et le traitement des micro-données provenant
de fichiers de grande taille constituent de ce point de vue un enjeu de
premier plan.

2. On appelle analyse secondaire d’une enquête ou d’une source administrative l’exploitation
ultérieure des données soit dans une même visée d’analyse que celle qui avait présidé à la
collecte, soit à des fins différentes.
8Les sciences sociales et leurs données
Si les gisements de données, qui peuvent être considérés comme des
gisements de connaissance sur la société, sont aujourd’hui très
nombreux, les chercheurs ne sont directement à l’origine que d’une très
petite fraction d’entre elles. Ils sont en particulier très dépendants des
données produites par la statistique publique ou générées par l’activité
administrative ou économique, qui apparaissent partout comme un
aliment essentiel des sciences sociales. Il n’est que de rappeler ici qu’un
ouvrage fondateur commeLe suicide d’Émile Durkheim prend appui sur
ce type de données. La France dispose sous ce rapport, avec son institut
national de statistique, l’Insee, d’un instrument souvent envié à
l’étranger.
L’accès à ces données, et surtout leur réilisutation, ne va cependant pas
de soi. De même que ne va pas de soi l’accès pour un chercheur à
d’autres types de données ; celles produites par d’autres chercheurs le
plus souvent avec de l’argent public, celles relevant de la sphère privée
des instituts de sondage ou celles, croissantes, générées par l’activité
économique et administrative.
Le rapport particulier que les chercheurs en sciences sociales
entretiennent avec leur données implique qu’il faut aborder trois points
de façon simultanée : leur place dans la production de ces données, la
régulation de l’accès à celles produites par d’autres, et la formation aux
méthodes d’analyses de ces données. Utiliser de façon rigoureuse des
données implique nécessairement de contrôler ou de bien connaître les
conditions de leur production. L’attention aux méthodes d’analyse va de
pair avec celle accordée à la construction des enquêtes (champs,
méthode de collecte, procédure d’échantillonnage etc.).
L’ensemble des dispositifs qui permettent de répondre à ces questions
relève d’une politique de la recherche et de moyens de long terme à
mettre en regard avec les « grands équipements » aux coûts sans
commune mesure, dont disposent d’autres domaines scientifiques.
Reprenant l’analogie entre le statut de l’observation en sciences sociales
et en astronomie, on peut parler de véritables « télescopes » qui restent à
mieux structurer, consolider, voire créer en France. Le retard pris en ce
domaine par notre pays est évident si l’on compare la France à d’autres
grands pays, les États Unis, la Grande Bretagne et l’Allemagne en
particulier.
La diversité des disciplines scientifiques relevant des sciences humaines
et sociales n’a pas permis à ce jour d’avoir une vision globale permettant
de repérer les zones de force et de faiblesse, les retards les plus
importants vis à vis d’autres pays occidentaux, les actions à mettre en
œuvre. Le bilan qui va suivre, les perspectives d’avenir qu’il permet de
tracer, devraient alimenter une réflexion collective des sciences sociales
françaises. Disposer d’enquêtes, d’observations plus largement, est un
enjeu clé au moment où d’importants réseaux de recherche
9I. Les grands enjeux
européens se mettent en place et développent de manière significative
des programmes de recherche comparative. Dans ce contexte
d’européanisation de la recherche, la collecte d’abord, l’organisation et
la conservation ensuite, le traitement et l’analyse des données enfin
constituent les trois piliers indispensables d’une politique scientifique
audacieuse permettant à la recherche française de tenir sa place. Mais
ceci ne peut se faire sans prendre en compte les conditions
contemporaines de production des données ainsi que l’évolution du
contexte juridique qui conditionnent le recueil comme l’usage des
données.
I.3. Structure de la production des données en sciences
sociales : une situation variable en fonction des disciplines
et des différences entre pays
La structure de la production des données utilisées par les sciencesDans tous les pays,
l’histoire de la sociales est une donnée historique et culturelle pour chaque pays,
statistique, de la reflétant les rapports particuliers de la recherche à l’État et à l’appareil
production et de la administratif. Or elle conditionne en partie l’utilisation des données. Elle
diffusion des peut aussi, dans une certaine mesure, induire une attention différente des
données publiques chercheurs (et une plus grande familiarité) aux conditions de production
est inséparable du de leurs données, ce qui est un chaînon important du raisonnement
rôle joué par les
scientifique.
scientifiques dans la
connaissance des
Les liens intrinsèques entre la statistique d’État et les sciences sociales
faits sociaux. Le lien
sont nombreux. Un fil continu court des premiers dénombrements aux
entre théorie
statistiques sociales d’aujourd’hui. Si la visée est bien administrative, ellesociologique et
implique constamment les scientifiques qui prônent la mise en placestatistique publique
d’enquêtes et sont aussi utilisateurs des informations ainsi produites.est fondamental.
Cette situation, amplifiée aujourd’hui par la révolution informatique, a
des racines historiques très anciennes. Sur la question de la mesure, les
sciences sociales entretiennent avec l’État un rapport à la fois étroit et
critique.
Le dénombrement est d’abord une opération lourde que les États
modernes vont imposer pour asseoir leur autorité et leur fonctionnement,
reprenant en cela des pratiques très anciennes. Comme l’a fait remarquer
3
Alain Desrosières ces descriptions ont un caractère secret à l’époque du
pouvoir royal. Le passage à un instrument destiné à

. L’ensemble de cette analyse s’appuie en grande partie sur les travaux d’Alain Desrosières, en
particulier : Desrosières A., (1993),L a politique des grands nombres. Histoire de la raison
statistique. Éd. La Découverte ; Desrosières A. (1998), L’administrateur et le savC aontu.rrie r
des Statistiques, n° 87 88. Insee.
Il faut également se référer à : Insee (1987 ) Pour , une histoire de la statistique , tomes 1 et 2.
Éd. Economica ;Savoye A. (1994), Les débuts de la sociologie empirique. Éd. Méridiens-
Klinsieck.
10

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.