Couplage de données pour les études démographiques - article ; n°4 ; vol.24, pg 653-684
33 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Couplage de données pour les études démographiques - article ; n°4 ; vol.24, pg 653-684

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
33 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Population - Année 1969 - Volume 24 - Numéro 4 - Pages 653-684
Des données pour un même individu se trouvent souvent sur des documents différents; leur utilisation concomitante pose des problèmes techniques parfois difficiles ou entraine de grandes pertes de temps. On peut citer, par exemple, le cas de la mortalité infantile selon la catégorie socio-professionnelle du père étudié en France dès 1951, par couplage de données appartenant à deux statistiques. M. H. B. Newcombe, biologue et généticien canadien, attaché à la recherche nucléaire, étudie le problème dans son aspect le plus général, expose les méthodes techniques de couplage des données, les diverses recherches déjà faites grâce à elles et les possibilités considérables qu'ouvrent, dans ce domaine, l'utilisation des ordinateurs les plus récents et diverses techniques apparentées, tant pour la collecte de renseignements que pour des contrôles administratifs.
32 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Sujets

Informations

Publié par
Publié le 01 janvier 1969
Nombre de lectures 27
Langue Français
Poids de l'ouvrage 2 Mo

Extrait

Howard B. Newcombe
Couplage de données pour les études démographiques
In: Population, 24e année, n°4, 1969 pp. 653-684.
Résumé
Des données pour un même individu se trouvent souvent sur des documents différents; leur utilisation concomitante pose des
problèmes techniques parfois difficiles ou entraine de grandes pertes de temps. On peut citer, par exemple, le cas de la mortalité
infantile selon la catégorie socio-professionnelle du père étudié en France dès 1951, par couplage de données appartenant à
deux statistiques. M. H. B. Newcombe, biologue et généticien canadien, attaché à la recherche nucléaire, étudie le problème
dans son aspect le plus général, expose les méthodes techniques de couplage des données, les diverses recherches déjà faites
grâce à elles et les possibilités considérables qu'ouvrent, dans ce domaine, l'utilisation des ordinateurs les plus récents et
diverses techniques apparentées, tant pour la collecte de renseignements que pour des contrôles administratifs.
Citer ce document / Cite this document :
Newcombe Howard B. Couplage de données pour les études démographiques. In: Population, 24e année, n°4, 1969 pp. 653-
684.
http://www.persee.fr/web/revues/home/prescript/article/pop_0032-4663_1969_num_24_4_14003COUPLAGE DE DONNÉES
POUR LES ÉTUDES DÉMOGRAPHIQUES
pertes statistiques. sur des en infantile France Des problèmes des de documents données temps. selon dès 1951, techniques la On pour catégorie différents; peut par un couplage citer, parfois même socio-professionnelle par leur difficiles de exemple, individu utilisation données ou le se entraine appartenant cas concomitante trouvent de du la père de mortalité grandes souvent à étudié deux pose
M. H. B. Newcombe, biologue et généticien canadien, attaché
à la recherche nucléaire, étudie le problème dans son aspect le
plus général, expose les méthodes techniques de couplage des
données, les diverses recherches déjà faites grâce à elles et les
possibilités considérables qu'ouvrent, dans ce domaine, l'utilisa
tion des ordinateurs les plus récents et diverses techniques appar
entées, tant pour la collecte de renseignements que pour des
contrôles administratifs.
INTRODUCTION
Par suite de récents développements, c'est à une échelle bien accrue qu'on
peut rapprocher, « coupler » ^', des données recueillies séparément, mais se
rapportant aux mêmes individus ou aux mêmes familles. La présente étude
décrit les méthodes utilisées pour assurer ce « couplage » de données à l'échelle
des statistiques et certains emplois possibles de cette technique en démograp
hie, dans les domaines voisins de 1' epidemiologie et de la génétique de popul
ation, ainsi que dans l'élaboration des statistiques sanitaires.
Lorsqu'on rapproche des séries de données recueillies indépendamment
et se rapportant au même individu, elles nous apprennent beaucoup plus sur
l'histoire et les caractéristiques de cette personne que l'une quelconque de ces
séries prise individuellement. De même, lorsque de tels couplages sont éta
blis à grande échelle, on peut en extraire une information statistique sensibl
ement plus riche que de quelque tableau que ce soit, établi à partir des données
séparées.
La manière dont, par exemple, se constitue la famille est fort bien collectée
dans les registres d'état-civil. Cependant l'importante information sur la fécon
dité des familles ne peut en être extraite que lorsque des séries de données ra
ssemblées tout au long d'une période étendue sont couplées par familles.
í1) N.D.T. « To link » signifiant « lier, associer, rapprocher, coupler », nous avons choisi de
le traduire par ce dernier mot et de rendre « linkage » par « couplage ». COUPLAGE DE DONNÉES POUR LES ÉTUDES DÉMOGRAPHIQUES 654
L'emploi du couplage des données, pour diverses sortes d'études de popul
ation, n'est nullement nouvelle, mais les laborieuses méthodes manuelles
utilisées dans le passé ont toujours limité à des enquêtes de peu d'envergure
l'application de cette technique. Avec l'avènement des ordinateurs,fon pouvait
au moins envisager l'expansion des couplages de données, mais^l'efficacité
de ces machines dans les opérations d'appariement nécessaires ^demeurait
incertaine. Il semblait que les principales difficultés surgiraient dans les cou
plages fondés sur les noms de personnes et sur divers autres éléments d'iden
tification sujets à caution par essence ou enregistrés sans uniformité.
Par le passé, les employés chargés de tenir des fichiers se voyaient, pour
cette raison même, obligés d'exercer, dans une large mesure, des jugements
apparemment subjectifs pour apparier avec exactitude les données relatives
à une même personne.
Ce n'est qu'avec le développement de méthodes qui permettent aux ma
chines d'appliquer des règles de jugement analogues à celles employées par
les humains qu'il est devenu possible de coupler d'importantes séries de don
nées à la fois vite, avec précision et à peu de frais.
Puisque c'est de l'efficacité de telles méthodes que dépend le succès ou
l'échec des efforts pour utiliser le couplage automatique des données à une grande
échelle, nous insisterons sur les techniques de couplage qui ont été élaborées
et sur les possibilités de perfectionner et de mener à bien les diverses sortes
de couplage pouvant intéresser les démographes.
HISTORIQUE DU COUPLAGE DES DONNÉES
L'idée de rapprocher des données sanitaires recueillies indépendamment,
pour reconstituer, à grande échelle, l'histoire des personnes, a commencé à
attirer l'attention, il y a environ un siècle. En 1861, William Farr a proposé
au Parlement britannique que l'histoire médicale des soldats soit tenue à
jour, de leur entrée dans l'armée à la date de leur congé définitif ou de leur
mort ; en 1875, il recommanda, dans son annexe au 35e rapport du « Registrar
General », comme objectif à long terme, la constitution pour la population
civile, de sortes de livrets médicaux où seraient consignés, au fur et à mesure,
tous les faits de mauvaise santé et le décès, « afin de permettre au médecin de
déterminer la durée et la létalité de toutes les formes de maladies, pour les
divers systèmes de soins, dans les différentes conditions, sanitaires et sociales
de la population... »
L'expression» Record Linkage » (couplage des données) fut employée pour
la première fois en 1946 par Halbert L. Dunn, à l'époque chef de Y Office
national des statistiques d'état civil des États-Unis, au cours d'une all
ocution prononcée devant un groupe de spécialistes canadiens des stati
stiques d'état civil, au moment où le Canada introduisait, pour la première
fois, à l'échelle nationale, un système uniforme d'immatriculation des nais
sances. Dunn considérait les faits d'état civil et les incidents de santé d'un COUPLAGE DE DONNÉES POUR LES ÉTUDES DÉMOGRAPHIQUES 655
individu comme les données d'un « livret de vie », qui s'ouvre le jour de la
naissance et se termine à la mort. Le nouveau système canadien d'immatricul
ation des naissances était destiné à faciliter le rapprochement des actes de et des archives d'assistance sociale de différentes sortes, et tout par
ticulièrement de celles du système canadien d'allocations familiales univers
elles, pour s'assurer que les enfants en faveur desquels on demandait les
allocations étaient effectivement venus au monde. Cette utilisation administ
rative des actes de naissances pour établir la composition des familles, pour
virtuellement tous les enfants canadiens, a nécessité l'organisation d'une vaste
opération manuelle de couplage de données, qui s'est poursuivie sans inter
ruption depuis 1946.
Il y a eu aussi de nombreuses utilisations démographiques du couplage
manuel des données, à des échelles plus modestes, pour des études qui auraient
pu être grandement facilitées et étendues, si les chercheurs avaient pu profiter
des mét

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents