Traitement des données manquantes dans les séries issues des registres paroissiaux - article ; n°1 ; vol.53, pg 249-270
24 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Traitement des données manquantes dans les séries issues des registres paroissiaux - article ; n°1 ; vol.53, pg 249-270

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
24 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Population - Année 1998 - Volume 53 - Numéro 1 - Pages 249-270
BONNEUIL (Noël). - Traitement des données manquantes dans les séries issues des registres paroissiaux L'enquête Biraben 1 500- 1 700 des registres paroissiaux est constituée de séries comportant des données manquantes. Pour compléter ces lacunes, il est préférable actuellement de recourir aux modèles ARIMA de l'économétrie des séries temporelles. On peut ainsi sélectionner quelles séries parmi les co-séries disponibles sont corrélées avec la série à compléter, identifier un modèle, le valider, et projeter pour combler peu à peu la période lacunaire. Des essais effectués sur des séries connues de l'enquête permettent déjuger des possibilités de cette méthode sur ce type de données temporelles. Des exemples sont donnés.
BONNEUIL (Noël). - Processing missing data in series produced from parish registers The Biraben survey 1500-1700 of parish registers involves series from which data are missing. The most satisfactory technique now available for filling these gaps is the ARIMA econometric models for time series. The procedure involves selecting which of the available co-series are correlated with the series to be completed; a model is then identified, validated and projected so as to gradually complete the period for which information is missing. Trials with the survey's complete series are used to judge the method's potential on this type of temporal data. Examples are given.
BONNEUIL (Noël). - Tratamiento de series incompletas en los registres parroquiales La encuesta Biraben 1500-1700 de registros parroquiales esta compuesta por series incompletas. Para completar las lagunas existentes, es recomendable utilizar los modelos econométricos ARIMA de series temporales. Este método permite seleccionar que series, entre las existences, están correlacionadas con la série incompleta, identificar un modelo, validarlo y completar la série. Las pruebas efectuadas con series complétas de la encuesta permiten evaluar las posibilidades de este método para este tipo de datos temporales. El articulo muesta varios ejemplos.
22 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Sujets

Informations

Publié par
Publié le 01 janvier 1998
Nombre de lectures 13
Langue Français
Poids de l'ouvrage 2 Mo

Extrait

Noël Bonneuil
Traitement des données manquantes dans les séries issues des
registres paroissiaux
In: Population, 53e année, n°1-2, 1998 pp. 249-270.
Citer ce document / Cite this document :
Bonneuil Noël. Traitement des données manquantes dans les séries issues des registres paroissiaux. In: Population, 53e
année, n°1-2, 1998 pp. 249-270.
http://www.persee.fr/web/revues/home/prescript/article/pop_0032-4663_1998_num_53_1_6854Résumé
BONNEUIL (Noël). - Traitement des données manquantes dans les séries issues des registres
paroissiaux L'enquête Biraben 1 500- 1 700 des registres paroissiaux est constituée de séries
comportant des données manquantes. Pour compléter ces lacunes, il est préférable actuellement de
recourir aux modèles ARIMA de l'économétrie des séries temporelles. On peut ainsi sélectionner
quelles séries parmi les co-séries disponibles sont corrélées avec la série à compléter, identifier un
modèle, le valider, et projeter pour combler peu à peu la période lacunaire. Des essais effectués sur
des séries connues de l'enquête permettent déjuger des possibilités de cette méthode sur ce type de
données temporelles. Des exemples sont donnés.
Abstract
BONNEUIL (Noël). - Processing missing data in series produced from parish registers The Biraben
survey 1500-1700 of parish registers involves series from which data are missing. The most satisfactory
technique now available for filling these gaps is the ARIMA econometric models for time series. The
procedure involves selecting which of the available co-series are correlated with the series to be
completed; a model is then identified, validated and projected so as to gradually complete the period for
which information is missing. Trials with the survey's complete series are used to judge the method's
potential on this type of temporal data. Examples are given.
Resumen
BONNEUIL (Noël). - Tratamiento de series incompletas en los registres parroquiales La encuesta
Biraben 1500-1700 de registros parroquiales esta compuesta por series incompletas. Para completar
las lagunas existentes, es recomendable utilizar los modelos econométricos ARIMA de series
temporales. Este método permite seleccionar que series, entre las existences, están correlacionadas
con la série incompleta, identificar un modelo, validarlo y completar la série. Las pruebas efectuadas
con series complétas de la encuesta permiten evaluar las posibilidades de este método para este tipo
de datos temporales. El articulo muesta varios ejemplos.TRAITEMENT DES DONNEES
MANQUANTES DANS LES SÉRIES
ISSUES DES REGISTRES
PAROISSIAUX
Noël BONNEUIL *
À partir de 1 980, J.-N. Biraben a constitué un échantillon de séries de nombres
d'actes de baptêmes, de mariages et de sépultures (ci-après dénotés BMS). La
collecte remonte jusqu'à la date d'apparition des registres paroissiaux, à partir du
XVIe siècle pour la plupart, et va jusqu'à 1700. Ce travail fait suite à celui de
L. Henry, qui a rassemblé des séries BMS de 1670 à 1839. Je ne traiterai pas ici
de la qualité des données existantes, mais de la façon de combler les lacunes qui
apparaissent dans de nombreuses séries. Il n'y a pas à se soucier ici de la qualité
des données existantes. Cette question fera l'objet d'un travail ultérieur.
La figure 1 montre qu'à toute date entre 1500 et 1700, il existe des données
manquantes parmi les paroisses rurales de l'enquête, et que ces lacunes se raréfient
avec le temps. Une légère accélération de la chute du nombre de registres lacunaires
en ce qui concerne les baptêmes, mais pas les sépultures, est visible en 1622, date
du Rituel romain, qui réglemente la tenue des registres. L'effet de la déclaration
de Saint-Germain de 1667, qui instaure un certain contrôle du pouvoir royal, est
beaucoup plus net sur les registres de sépultures, dont la proportion de lacunes
rejoint celles des mariages et des baptêmes. Les figures 2, 3 et 4 donnent une idée
de la qualité des séries. Ces cartes représentent la plus longue période observée
sans lacune parmi les paroisses d'un département donné. Les ressemblances de ces
cartes entre elles traduit la qualité globale des registres d'un même département.
Cependant, les périodes de plus grande longueur ne concernent pas forcément la
même paroisse. Par exemple, dans Г Ille-et- Vilaine, Treverien a la série de baptêmes
la plus longue du département (1565-1700), Chantepie celle de sépultures (1500-
1650), Noyal-sur-Seiche celle de mariages (1615-1700). Les séries de grande lon
gueur se retrouvent dans la plupart des grandes régions françaises : Bretagne,
une ligne Bassin parisien-Auvergne, vallée de la Garonne, Provence, Rhône.
* Institut national d'études démographiques et École des hautes études en sciences sociales.
Population, 1-2, 1998, 249-270 N. BONNEUIL 250
Proportion de lacunes
1.0 -Г
0.9-
0.8-
Sépultures
0.7-
0.6-
Mariages -\
0.5-
Baptêmes \,
0.4-
0.3-
0.2-
0.1 -
1500 1600 1700
Temps
Figure 1. - Proportion de lacunes parmi les 535 paroisses rurales
de l'enquête Biraben rurale, 1500-1700
La région du Nord, le Sud-Ouest, les Bouches-du-Rhône, la Lorraine, le Maine,
ou la façade Charente- Vendée ont notablement des séries morcelées.
La qualité des séries de Normandie (aucune lacune de 1588 à 1700) avait
permis notamment de reconstruire la population de onze paroisses en Pays de
Caux (Biraben et Bonneuil, 1986), et de dégager la dynamique de la fécondité
(Bonneuil, 1990). Reconstruire la population française par département nécessite TRAITEMENT DES DONNEES MANQUANTES 251
Figure 2. - Plus longue période sans lacune par département
(en années). Baptêmes, enquête Biraben, France rurale 252 N. BONNEUIL
manquant < 21 [21,37[ [37,58[ [58,178]
Figure 3. - Plus longue période sans lacune par département
(en années). Sépultures, enquête Biraben, France rurale TRAITEMENT DES DONNEES MANQUANTES 253
manquant <21 [21,38[ [38,64[ [64,126]
Figure 4. - Plus longue période sans lacune par département
(en années). Mariages, enquête Biraben, France rurale 254 N. BONNEUIL
de disposer de séries complètes ou complétées de la manière la plus fiable possible.
C'est précisément l'objet de cet article : constituer des séries avec un minimum
de données manquantes afin de préparer la reconstruction des populations, selon
un découpage géographique qui reste à définir. Ce travail, effectué sur les registres
paroissiaux, prolongera la reconstruction de la population française au XIXe siècle
établie sur la base de l'état civil et des recensements (Bonneuil, 1997).
I. - Sélectionner des séries co-variantes
et modéliser les со- variations temporelles
Les modèles ARIMA Les modèles ARIMA {AutoRegressive Inte-
avec fonction de transfert grated Moving Average) sont devenus clas
siques depuis l'ouvrage de Box et Jenkins
(1976). On en trouve une présentation dans Grenier (1991) à propos des séries
de prix, de l'indice boursier, ou des interactions entre démographie, climat et prix.
En démographie, Bonneuil et Fargues (1988), par exemple, les ont utilisés pour
étudier les relations intertemporelles entre séries de causes de décès, climatologie
et prix.
Ces modèles permettent de quantifier la mémoire d'un processus temporel,
éventuellement les interactions avec d'autres séries, aux fins de prévision de court
terme. Ils sont construits directement à partir des données empiriques disponibles.
Il est donc naturel de les utiliser pour reconstituer les données manquantes des
séries de registres paroissiaux. Cependant, cela n'a pas encore été fait, à ma
connaissance. Blanchet (1984) a proposé une méthode différente de ces procédures
sur le même sujet — la reconstitution des données manquantes du même ensemble
de séries. J'aurai donc dans la suite de cet article à m'y référer pour comparer ses
performances à celles des ARIMA.
ARIMA et séries BMS Soit une série temporelle X(t). On note В
teur retard :
BX(t) = X(t-\) [1]
de sorte que Д = 1 — В est l'opérateur « différence première » :
AX(t) = X(t) -X(t-l) [2]
La forme générale des modèles ARIMA avec fonctions de transfert s'écrit :
] j Xj(t) + O(B)e(t) [3]

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents