Validation des données françaises de l'enquête SHARE à l'aide de données externes d'autres enquêtes : les exemples de la santé et du revenu

De
Publié par

Parmi toutes les grandes enquêtes européennes, l’enquête SHARE présente la caractéristique unique d’avoir exactement le même questionnaire dans tous les pays pour assurer une parfaite comparabilité des données. Le revers de la médaille est que la traduction et la transposition de concepts généraux dans un contexte national est délicate. En mettant l’accent sur les revenus, où les spécificités nationales sont nombreuses, et sur la santé, où elles le sont moins, on valide la robustesse des résultats français de SHARE à la traduction en les comparant avec d’autres enquêtes de l’Insee. L’enquête SHARE française parvient à s’approcher des bons taux de perception pour les trois principaux types de revenu, salaires, retraites et bénéfices des indépendants, mais manque les revenus des conjoints éligibles mais non-répondants.
Publié le : dimanche 30 décembre 2012
Lecture(s) : 18
Tags :
Nombre de pages : 9
Voir plus Voir moins

Validation des données françaises
de l’enquête SHARE à l’aide de données
externes d’autres enquêtes :
les exemples de la santé et du revenu
Christelle Garrouste*, Pascal Godefroy** et Anne Laferrère**
Parmi toutes les grandes enquêtes européennes, l’enquête SHARE présente la caractéristique
unique d’avoir exactement le même questionnaire dans tous les pays pour assurer une par-
faite comparabilité des données. Le revers de la médaille est que la traduction et la transposi-
tion de concepts généraux dans un contexte national est délicate. En mettant l’accent sur les
revenus, où les spécificités nationales sont nombreuses, et sur la santé, où elles le sont moins,
on valide la robustesse des résultats français de SHARE à la traduction en les comparant avec
d’autres enquêtes de l’Insee. L’enquête SHARE française parvient à s’approcher des bons
taux de perception pour les trois principaux types de revenu, salaires, retraites et bénéfices
des indépendants, mais manque les revenus des conjoints éligibles mais non-répondants.
1
’enquête SHARE (Survey of venir d’une couverture géogra-
Health, Ageing and Retirement in phique, de dates de collecte, ou deLEurope) sur les personnes âgées périodes de référence d’une question
de 50 ans et plus en Europe est avant différentes, de la personne qui, dans
tout européenne : le questionnaire est le ménage, répond à la question, de la
exactement le même dans les qua- formulation même des questions. Les
torze pays (Allemagne, Autriche, Bel- différences apparaissent aussi selon
Logo de l'enquête SHAREgique, Danemark, Espagne, France, les pratiques des organismes de col-
Source : IRDES
Grèce, Italie, Pays-Bas, Suède, Suisse, lecte, par exemple dans les techni-
Pologne, République Tchèque, de réduire les erreurs manifestes et as- ques d’échantillonnage ou
Irlande) de l’enquête et chaque sure la comparabilité de base. Toute- d’entretien. Nous nous affranchissons
échantillon national est de taille mo- fois, le questionnaire de SHARE est ici de ce dernier effet en mettant en
deste. Le présupposé de SHARE est pluridisciplinaire, donc sa traduction relation les résultats de quelques
d’avoir un questionnaire harmonisé devrait être vérifiée par autant de spé- variables clefs issues d’enquêtes toutes
ex ante. Il semble assez facilement ap- cialistes dans chaque pays. Ceci n’est réalisées par l’Insee : les enquêtes
plicable dans les domaines qualitatifs pas le cas pour des raisons tant prati-
SHARE, Santé, Logement et SRCV (Sta-
comme celui de la santé, ou dans un ques que budgétaires, d’où certains
tistiques sur les revenus et les condi-
domaine quantitatif mais sans ambi- risques d’approximation. Dans le but
tions de vie, déclinaison française du
guïté conceptuelle, par exemple le de vérifier ex post la qualité de la tra-
panel européen EU-SILC - Survey on
poids et la taille. Mais il est plus diffi- duction et de la transposition au
Income and Living conditions).
cile à tenir dans des domaines où contexte national, nous présentons
chaque pays a ses propres systèmes, dans cet article un exemple de valida-
histoires et institutions. Derrière la tion d’une enquête par d’autres en-
1. L’enquête SHARE a été financée principalement parlangue se cachent ces spécificités na- quêtes. Nous nous concentrons ici e
la Commission européenne via le 5 programme cadre
tionales qui façonnent la manière sur le cas de la France, et nous vali- (projet QLK6-CT-2001- 00360 du théma-
etique Qualité de vie) et via son 6 programme cadredont chaque question est comprise dons les résultats de l’enquête SHARE
(projets SHARE-I3, RII-CT- 2006-062193, et
par les répondants, et par les cher- en matière de santé et de revenu à
COMPARE, CIT5-CT-2005-028857). Un financement
cheurs qui les utilisent. Une vérifica- l’aide des données externes d’autres complémentaire a été fourni par le National Institute
on Ageing (U01 AG09740-13S2, P01 AG005842,tion générale de la traduction permet enquêtes thématiques réalisées par
P01 AG08291, P30 AG12815, Y1-AG-4553-01 and
l’Insee. OGHA 04-064). Des financements nationaux com-
Les différences entre enquêtes sur des plémentaires ont été fournis en France par la Cnam, la
Cnav, le Cor, la Drees, la Dares, la Caisse des Dépôts
questions a priori identiques ont des
* Université de Padoue, Italie et Consignations, le Commissariat Général du Plan et
origines diverses : elles peuvent pro-** Insee l’Insee.
Courrier des statistiques n° 129, juin 2010 1Validation des données françaises de l’enquête SHARE à l’aide des données externes d’autres enquêtes...
Échantillons moins de 50 ans. Dans l’analyse au dans le tableau 2. L’échantillon de
de SHARE, de SRCV SHARE est de taille modeste par rapniveau des ménages, nous conser- -
et de l’enquête Logement vons ceux dont un membre a 50 ans port à celui de l’enquête Logement,
ou plus, ce qui est assez proche du qui représente presque dix fois sa
SHARE et toutes les enquêtes mobili- protocole d’échantillonnage de taille, mais aussi par rapport à celui
sées dans cet article ont été tirées SHARE. En France, SHARE n’est réa- de SRCV, trois fois plus grand.
dans l’échantillon maître de l’Insee lisée que dans 6 (en vague 1) ou 7 ré-
constitué après le recensement de gions (en vague 2). En vague 2, les Le tableau 3 fournit, non pondérées,
1999, représentatif de tous les loge- les structures par sexe et âge des diffé-personnes qui ont déménagé en éta-
ments, actualisé par tirage au sort blissements pour personnes âgées dé- rents échantillons. SRCV en 2006
dans le stock de logements neufs pendantes depuis la vague 1 contient 53 % de femmes, l’enquête
construits depuis cette date. Le tableau 1 continuent d’être interrogées. Un Logement de 2006 et la vague 1 de
SHARE 55 % et la vague 2 56 %. L’é-donne les enquêtes sur lesquelles échantillon de rafraîchissement a en-
nous effectuons la comparaison. richi l’échantillon longitudinal en chantillon de SHARE en vague 2 est
vague 2. SRCV utilise un panel rotatif un petit peu plus vieux, du fait d’un
Le champ de SHARE est celui des 50 biais de rétention : plus les individussur une période de neuf ans : chaque
ans et plus. Nous harmonisons donc sous-échantillon est visité neuf an- sont mobiles, plus ils sont difficiles à
les échantillons en supprimant des nées à la suite. Les tailles des échantil- réinterroger, et les plus mobiles sont
autres enquêtes les répondants de lons de chaque enquête sont données aussi les moins âgés. Pondérées, les
Tableau 1 - Échantillonnage
Régions Date de collecte Échantillonnage
SHARE 04-05 Île-de-France, Nord-Pas-de-Calais, Été 2004 ou été 2005 Ménages en logement ordinaire composés d’au
(vague 1) Pays de la Loire, Aquitaine, moins un individu né avant 1955
Rhône-Alpes,
Languedoc-Roussillon
SHARE 2006 Idem SHARE 04-05 + Paca Fin de nov.2006- Panel (y compris établissements d’hébergement
(vague 2) fin janv.2007 pour personnes âgées dépendantes si l’individu y
a emménagé) + échantillon de rafraîchissement’au
moins un individu né avant 1957
Enquête Santé et des soins France Métropolitaine 2002-2003 Ménages en logement ordinaire
médicaux 2002-2003
Enquête Logement 2002 (EL 2002) Déc. 2001- janv. 2002
Enquête Logement 2006 (EL 2006
2006)
SRCV 2006 France Métropolitaine 2006 Ménages en logement ordinaire Panel rotatif
(revenus et conditions de vie)
Tableau 2 - Tailles des échantillons
Niveau Elégibilité Taille des échantillons
SHARE France 2004/05 (vague 1) Ménage Dont au moins un répondant est né avant 1955 2 110
Individu Répondant (né avant 1955) 3 038
SHARE France 2006 (vague 2) Ménage Dont au moins un répondant est né avant 1957 2 038
Individu Répondant (né avant 1957) 2 793
Enquête Logement 2002 Ménage 17 533 (10 220)
Individu Répondant (né avant 1955) 27 723 (16 010)
Enquête Logement 2006 Ménage 17 134 (10 507)
Individu Répondant (né avant 1957) 26 860 (16 441)
SRCV 2006 (revenus et conditions de vie) Ménage Dont au moins un répondant est né avant 1957 5 669 (2 651)
Individu 8 636 (4 003)
Précision : les chiffres entre parenthèses correspondent à la taille de l'échantillon de l'enquête considérée, restreint au nombre de régions de l'enquête SHARE vague 2.
Source : calcul des auteurs à partir de SHARE vagues 1 et 2, des enquêtes Logement 2002 et 2006 et de SRCV 2006
2 Courrier des statistiques n° 129, juin 2010Christelle Garrouste, Pascal Godefroy et Anne Laferrère
proportions de femmes parmi les 50 ans table» dans l’échelle américaine et par se basant sur la place de la question
«moyenne» dans l’échelle (aléatoirement, la moitié des répon-et plus tournent autour de 55 % dans
SHARE et dans l’enquête logement européenne. dants étaient interrogés sur leur santé
2006. Les échantillons ne sont pas subjective après de nombreuses ques-
une source majeure de différences Quand les enquêtes utilisent la même tions sur des affections variées ; l’autre
échelle, et une formulation presqueentre les enquêtes moitié avant ces mêmes questions),
identique (très bonne, bonne, Clark and Vicard (2007) ont montré
moyenne, mauvaise, très mauvaise que «répondre après» induit une
Une question subjective : pour SHARE en vague 1 et l’enquête forme d’optimisme sur sa propre santé
l’état de santé auto-déclaré, Santé ; très bon, bon, assez bon, mau- comparée à la situation où la question
dans trois enquêtes de l’Insee vais, très mauvais pour SRCV), les trois est posée avant (comme dans l’en-
donnent des résultats similaires sur ces quête Santé) ou si elle n’est pas posée
Dans SHARE, dans SRCV et dans l’en- mêmes questions. Toutefois les répon- dans un ensemble de questions
quête Santé, on interroge les person- dants à SHARE sont un peu plus opti- objectives sur la santé (comme dans
nes sur leur état de santé ressenti, en mistes que les autres sur leur santé. En SRCV).
leur demandant de se situer sur une
2
échelle à cinq catégories . La compa-
raison directe des distributions des ré-
Encadré - L’enquête SHARE
ponses des trois enquêtes n’est pas
L’enquête SHARE (Survey of Health, Ageing, and Retirement in Europe) est une ini-
possible car l’échelle proposée varie
tiative de chercheurs en économie, en sciences sociales et en santé publique, sou-
selon les enquêtes. Précisément tenue par la Commission européenne. En s’appuyant sur des expériences
SRCV, l’enquête Santé, et une moitié américaines et britanniques, ils ont défini un questionnement commun à l’ensemble
de l’échantillon de la vague 1 de des pays participants. Fortement coordonné au niveau européen, SHARE se carac-
SHARE ont recours à l’échelle dite térise par une méthodologie unique et une collecte synchronisée : le centre de tech-
niques d’enquête de l’Université de Tilburg joue un rôle pilote pour la collecte eteuropéenne (dont les catégories sont :
l’harmonisation du questionnement est effectuée par le Mannheim Research Insti-very good, good, fair, bad,and very bad),
tute for the Economics of Ageing (MEA). Onze pays européens dont la France ontet l’autre moitié de l’échantillon de la
participé à la première vague, rejoints en 2006 par trois autres pays continentaux et
vague 1 de SHARE, et tout l’échantil-
Israël. L’enquête comporte trois volets : un questionnaire classique rédigé en an-
lon de vague 2 utilisent la version dite glais et traduit dans la langue de chaque pays participant, des tests physiques (apti-
américaine de l’échelle (dont les caté- tude à la marche et force de préhension) et un papier auto-administré.
gories sont : excellent, very good, good,
fair and poor). L’échelle européenne n’a Toutes les données du questionnaire principal qui comprend 22 modules sont admi-
nistrées en face-à-face par collecte assistée par ordinateur. Tous les répondants neque deux « bonnes » catégories, et l’a-
passent pas par tous les modules du questionnaire ; les modules qui font référenceméricaine en a trois.
au couple ou au ménage plutôt qu’à l’individu ne sont administrés qu’à l’individu dé-
signé pour répondre : le répondant ménage, ou le répondant logement, selon leLes distributions des réponses ont ce-
thème du module.
pendant toutes le même mode good
(= « bonne » dans les deux échelles), Trois vagues d’enquêtes sur des échantillons de personnes de 50 ans ou plus ont
quelle que soit l’enquête. Ce mode déjà été lancées depuis 2004 ; la plus récente, «histoire de vie», en 2009 a cherché à
correspond soit à la deuxième modali- retracer le cycle de vie des personnes interrogées en vagues 1 et 2, et ce dans des
té de l’échelle européenne, soit à la domaines variés (vie de famille, emploi, logement, santé).
troisième modalité de l’échelle améri-
caine.C’estunrésultatensoi:silesré-
ponses dépendent pour partie du rang
des modalités dans l’échelle, elles dé- Tableau 3 - Composition des échantillons par sexe et âge, données non pondérées (%)
pendent aussi, et fortement, de la for-
mulation de ces modalités. La Échantillon Femmes 50-59 60-69 70-79 80+ Tous
première modalité de l’échelle améri-
caine, excellent, peut ainsi avoir un
SHARE 04-05 (né <1955) 55,0 40,7 26,1 22,7 10,6 100
sens différent de very good,première
modalité de l’échelle européenne. Le SHARE 2006 (né <1957) 55,8 37,9 28,9 22,1 11,2 100
choix de traduction intervient aussi.
EL 02 (né <1955) 53,9 45,6 24,8 21,2 8,4 100Ainsi en vague 1 de SHARE la caté-
gorie fair a été traduite par «accep-
EL 06 (né <1957) 54,6 41,7 26,5 21,1 10,7 100
SRCV 2006 (né <1957) 52,9 39,6 27,9 21,8 10,6 1002. Par exemple pour SHARE 2006 la question
est : «Diriez-vous que votre santé est : 1) excel-
Source : calcul des auteurs à partir de SHARE vagues 1 et 2, des enquêtes Logement 2002 et 2006 et delente, 2) très bonne, 3) bonne, 4) acceptable,
SRCV 20065) médiocre».
Courrier des statistiques n° 129, juin 2010 3Validation des données françaises de l’enquête SHARE à l’aide des données externes d’autres enquêtes...
les revenus des éventuels logementsGraphique 1 - Bonne santé auto-déclarée par âge SRCV, SHARE et enquête Santé
de rapport du ménage. Puis, dans une
en % section ménage, le répondant
80
«ménage» est interrogé sur le revenuSHARE 2006 SHARE 04/05 SRCV2006 Enquête Santé 2002-2003
70 des membres du ménage non éligi-
bles à l’enquête, et sur les prestations60
reçues au niveau du ménage. Le ré-
50
pondant «ménage» déclare donc les
40 revenus du niveau ménage et le reve-
nu des autres membres du ménage à30
condition qu’ils ne soient pas éligibles.
20
Mais il n’informe en aucune façon sur
10 le revenu de l’autre membre éligible
du ménage, son conjoint. Chaque éli-
0
50-59 ans 60-69 ans 70-79 ans 80 ans et + gible doit être présent et souhaiter ré-
Source : calcul des auteurs à partir de SHARE vagues 1 et 2, de l’enquête Santé et de SRCV 2006 pondre ; dans le cas contraire aucun
revenu individuel n’est connu pour le
Pour faciliter les comparaisons, nous second est une validation à la marge conjoint absent ou non répondant.
avons construit une mesure binaire intensive définie par la distribution Enfin le module patrimoine interroge
de la santé auto-déclarée : elle re- des revenus parmi les bénéficiaires. ce même répondant ménage sur les
groupe dans une catégorie « en Cette séparation entre marges exten- intérêts perçus. La personne du mé-
bonne santé les individus qui décla- sive et intensive correspond aussi à la nage sélectionnée pour être le répon-
rent excellent, very good, ou good sur façon dont les questions sont posées dant «ménage» et «logement» peut
l’échelle américaine, et ceux qui dé- dans les enquêtes Insee : d’abord une changer entre les vagues. Entre les va-
clarent very good ou good sur l’échelle interrogation sur la perception de tel gues 1 et 2 de SHARE, certains chan-
européenne. Le graphique 1 présente ou tel type de revenu, ensuite les gements ont été apportés aux
les pourcentages de répondants à questions sur les montants. Accepter questions sur les revenus (Garrousteet
SHARE, à SRCV et à l’enquête Santé de dire si l’on reçoit tel type de revenu al., 2010). Le principal concerne le
auto-déclarant une «bonne» santé se- est plus facile que de donner le mon- questionnement sur les salaires, spé-
lon cette mesure reconstruite, par tant. Une telle séparation facilite cifiés comme « avant toute déduc-
âge. donc les imputations en cas de tion » en vague 1 et « net des
3
non-réponse sur les montants . cotisations » en vague 2, permettant
Le déclin avec l’âge de la santé une meilleure comparabilité avec les
auto-déclarée est important. L’en- autres enquêtes Insee. Un autre chan-
quête Santé se situe «entre» SRCV et Des protocoles de collecte gement concerne les versements de
SHARE pour les 50-79 ans, mais un du revenu différents retraites perçues, spécifiés comme
peu au-dessus pour les plus de 80 ans. selon les enquêtes « moyens » en vague 1 et « normaux »
Elle est plus proche de SHARE que de en vague 2. Par ailleurs une question
SRCV, ce qui confirme que le thème Les questions sur les revenus dans globale sur le revenu mensuel du mé-
SHARE sont réparties dans différentesde l’enquête influence les réponses. nage a été ajoutée.
sections du questionnaire. D’abord
le module individuel « Emploi et Ce mode de questionnement relative-La collecte du revenu
Pensions » recueille le statut profes- ment fragmenté de SHARE est diffé-
Si certaines questions quantitatives, sionnel, le salaire ou le revenu des rent de celui des enquêtes
comme par exemple le poids et la travailleurs indépendants (le dernier, traditionnelles de l’Insee, dans
taille déclarés, ne présentent aucune et sur l’année écoulée), le type détail- lesquelles le revenu est abordé à la
ambigüité conceptuelle, la mesure du lé de retraite et les montants de re- toute fin du questionnaire. Ceci dans
revenu se prête moins simplement à traite, ainsi que les prestations le but de ne pas compromettre toute
une interrogation européenne unifiée. sociales individuelles, auprès de l’enquête parce que beaucoup
chaque membre du ménage éligible à d’enquêtés n’aiment pas parler de
La qualité des données portant sur le l’enquête. Ensuite vient un module leur revenu. De plus, dans ces enquê-
revenu dans SHARE peut être validée sur le logement, dans lequel on de- tes traditionnelles, les questions sur le
selon deux axes. Le premier est une mande au seul répondant «logement» revenu sont clairement divisées en
validation à la marge dite extensive : deux parties, marge extensive et
taux de perception de chaque type de marge intensive. En premier lieu, une
3. Le statisticien dispose alors d’une assise pour lesrevenu, taux de non-réponse sur le liste de sources de revenus possibles
imputations post-collecte si par exemple l’entretien amontant conditionnellement à la per- (salaires, allocations, bénéfices,été interrompu au milieu de la section revenu par la
ception de chaque type de revenu. Le volonté de ne pas en dire plus, ou par ignorance des retraites, rentes, loyers…) est pro-
montants.
4 Courrier des statistiques n° 129, juin 2010Christelle Garrouste, Pascal Godefroy et Anne Laferrère
Graphique 2 - Situation actuelle vis-à-vis de l’emploiposée, et un répondant «ménage»
précise si un membre du ménage les
en %perçoit, et si oui lequel (son prénom
70ou identifiant est récupéré à partir de
SHARE 2006 SHARE 04/05 SRCV 2006 EL 2006la section composition du ménage).
60
Ensuite seulement, les montants rela-
tifs aux douze derniers mois sont de-
50
mandés, avec des précisions sur les
primes ou bonus, pour chaque béné-
40
ficiaire. Finalement, des vérifications
sont effectuées afin de s’assurer de la
30
plausibilité du revenu mensuel global
du ménage. Ces vérifications sont im- 20
portantes pour les petits revenus ; le
répondant peut oublier certains trans- 10
ferts familiaux par exemple. Elles per-
mettent aussi de corriger des erreurs 0
Salarié Fonctionnaire Indépendant Retraité Chômeur Au foyer Autre
de saisie pendant la collecte. Une diffé- secteur privé sans emploi sans emploi sans emploi
rence avec SHARE est donc bien que
Source : calcul des auteurs à partir de SHARE vagues 1 et 2, de l'enquête Logement 2006 et de SRCV
ces questions sont posées pour chaque 2006
membre du ménage, mais pas néces-
sairement au bénéficiaire lui-même, le
4
but étant d’obtenir une information tants, mais aussi de gagner du temps . tes, revenus d’activité non salariée et
précise d’autant d’informateurs que Des contrôles de plausibilité amélio- allocations chômage), attardons-nous
possible. La source d’information peut rent la qualité des résultats : sur la situation d’emploi déclarée à la
être n’importe quel membre du mé- date de chacune des enquêtes. Cette
nage connu. Si un doute existe sur le re- – à la marge extensive pour éviter les situation est déconnectée du type de
venu de l’un des membres du ménage oublis (par exemple, « vous perce- revenus perçus puisque certains indivi-
parce qu’il est absent durant l’entretien, viez une pension de retraite dus peuvent percevoir à la fois salaires,
l’année dernière, plus cette année.l’enquêteur peut rappeler par télé- retraites et revenus d’activité non sa-
Avez-vous oublié de la mentionner ? »)phone et corriger sa valeur. lariée, et que la situation profession-
ou les doubles comptes ; nelle courante peut différer de celle des
– longitudinaux à la marge intensive,L’enquête SRCV sur les revenus et les douze derniers mois, ou de celle de
quand l’écart entre les vagues estconditions de vie, cumule deux ni- l’année précédente.
jugé trop important ; contrôles quiveaux de questionnement : un niveau
impliquent que de nombreusesménage pour les revenus non indivi- Dans le champ des 50 ans et plus, la
variables soient chargées préalable-dualisables tels que les allocations lo- proportion de salariés du secteur pri-
ment à l’enquête.gement ou les revenus du capital; un vé varie de 16 % dans SRCV à 20 %
niveau individuel, pour tous les mem- dans SHARE en vague 2 ; celle desDans SRCV comme dans SHARE si le
bres du ménage de plus de 16 ans, montant n’est pas obtenu, la collecte fonctionnaires de 7 % dans SHARE en
pour les revenus individualisables tels vague 2 à 8 % dans SRCV et dans l’en-d’une information par tranche est
que salaires, allocations chômage, quête Logement ; celle des travail-lancée.
retraites, allocations maladie, etc. leurs indépendants de 4 % dans SRCV
La période de référence est l’année et dans la vague 1 de SHARE, à 6 %
Comparaison des tauxn-1. Comme pour d’autres enquêtes dans la vague 2 de SHARE (graphique
de perception d’un type de revenuInsee, pour les sections individuelles, 2). Finalement les trois enquêtes sont
un autre membre du ménage (proxy) proches, avec un pourcentage de sa-
Avant de nous concentrer sur les quatrepeut répondre à la place de l’individu lariés (secteurs public et privé
éligible, lorsqu’il n’est pas présent le grands types de revenu (salaires, retrai- confondus) plus élevé dans la vague 2
jour de la collecte. La série des ques- de SHARE que dans la vague 1, et plus
4. Comme plus de 95 % des foyers font une déclarationtions sur la perception des revenus est faible dans SRCV (28 %) que dans
de revenu, même les non-imposables, un appariement
posée avant les questions sur les mon- l’enquête Logement 2006 (31 %).avec une source fiscale a été introduit, pour alléger la
tants, conformément à la stratégie de collecte de ces revenus depuis ceux de 2007. Si les Cela peut venir de ce qu’ils sont
questions sur la perception de tels types de revenus«balayage» des enquêtes Insee. Le ré- mieux repérés dans SHARE : en effet
continuent d’être posées pour faciliter les imputations
pondant est encouragé à regarder dans SRCV et dans les enquêtes Loge-en cas d’échec de l’appariement, les montants imposa-
bles ne sont plus collectés directement auprès du mé-dans ses documents administratifs ment, il y a davantage de bénéficiai-
nage (sauf dans le cas des jeunes âgés de 18 à 25 ans
(déclaration de revenu par exemple) res de salaires que d’individus classésdont les revenus sont déclarés sur les déclarations de
afin d’accroître la précision des mon- leurs parents avec qui ils n’habitent plus). en tant que salariés. Inversement,
Courrier des statistiques n° 129, juin 2010 5Validation des données françaises de l’enquête SHARE à l’aide des données externes d’autres enquêtes...
Graphique 3 - Perception d’un type Graphique 4 - Non-réponse Enfin, dans SRCV, 5,5 % des individus
de revenu (niveau individuel) parmi les bénéficiaires de 50 ans et plus perçoivent une allo-
en %en % 3570 cation chômage l’année précédente,
SHARE 2006 SHARE 04/05 SRCV 2006SHARE 2006 SHARE 04/05 SRCV 06
alors que seulement 3,8 % sont clas-EL 2002 EL 2006EL 2006 EL 2002
3060 sés en chômeurs sans emploi. L’en-
quête Logement donne 3,7 % en
2550 2002 et en 2006. La sous-estimation
des revenus du chômage semble plus
40 20
importante dans SHARE : seulement
2,9 % en perçoivent en vague 1 (et
1530
1,3 % en vague 2). Une explication
pourrait être que l’item apparaît dans
1020
la liste des différents types de retraites,
alors que dans la logique française,510
les allocations chômage sont da-
vantage liées à l’activité, et sont plus00
Retraites Salaires Revenus d’activité ChômageRetraites Salaires Revenus d'activité Chômage souvent classées comme allocations,non salariéenon salariée
Notes : la réception pour une retraite correspond à la Source : calcul des auteurs à partir de SHARE dans une question autonome.
réception d’au moins un type de retraite dans SRCV vagues 1 et 2, de l'enquête Logement 2002 et
2006 ; les retraites présentées ici excluent la pension 2006 et de SRCV 2006
Ainsi, SHARE obtient de bons taux dede réversion et d’invalidité mais incluent la retraite de
base, les préretraites, les minimums vieillesse et perception pour les trois grands typescapacity pension, présent en vague 1
contributif ; les réponses en tranche sont comptées de revenu : retraites, salaires et reve-et traduit par «Une prestation pu-
comme de la non-réponse. Données non pondérées.
nus d’indépendants. Néanmoins, lesblique d’invalidité (AAH, APA)», itemSource : calcul des auteurs à partir de SHARE
vagues 1 et 2, des enquêtes Logement 2002 et allocations chômage semblent plusqui a été déplacé dans une nouvelle
2006 et de SRCV 2006
problématiques. Une raison probablequestion sur les prestations en vague 2,
est que la logique des classements desDisability insurance benefits (traduit
revenus dans SHARE n’est pas biendans SRCV, 59 % des individus décla- par « Prestation d’invalidité » (PSD,
rent être retraités sans emploi, 55 % comprise par les répondants. Il pour-ACTP, AAH, APA). Ceci ne simplifie pas
rait être utile d’introduire plus claire-dans l’enquête Logement 2006, 54 % les comparaisons. Si on exclut ces pen-
ment la distinction entre salaires,dans SHARE en vague 1, et seulement sions d’invalidité de SRCV, le taux est le
50 % dans SHARE en vague 2. Les revenus des indépendants, allo-même que dans SHARE : 54 % des in-
chômeurs représentent 3 % des indi- cations, retraites, à la fois au niveaudividus perçoivent une retraite.
individuel et au niveau ménage. Devidus (4 % dans SRCV).
plus, une vérification par pays qu’au-De plus, alors que dans SRCV et
Selon SRCV, en 2006, 56 % des 50 ans l’enquête Logement en 2006, 28 % cune des allocations existantes n’a
et plus perçoivent une retraite été omise pourrait limiter les risqueset 29 %, respectivement, des 50 ans
d’oublis et autres erreurs de classifi-(graphique 3). Ce taux est le même et plus perçoivent des salaires, ce
dans l’enquête Logement 2002 mais taux monte à 30 % à l’enquête Loge- cation de la part des répondants.
il est un peu plus élevé dans l’enquête ment 2002 et SHARE en vague 1, et à
Logement 2006 (59 %). En vague 1 de 31 % en vague 2 de SHARE. La part La non-réponse partielle
SHARE, 58 % des individus perçoi- de ceux qui perçoivent un revenu
Une autre façon de comparer lavent au moins un type de retraite, d’indépendants est de 4 % dans
qualité des données consiste à exami-mais la proportion est de 56 % une SRCV. Le taux de réception corres-
ner les taux de non-réponse partielle.fois exclue la pension de réversion, ce pondant est de 5 % dans l’enquête
La non-réponse partielle se définitqui correspond au taux de l’enquête Logement de 2006, comme dans la
comme une ponctuelleLogement de 2002. En vague 2 de vague 2 de SHARE, mais seulement
à une question pour un individuSHARE, ce taux diminue à 54 %, ce de 3 % en vague 1, même si 4 %
échantillonné. L’absence d’informa-qui est inférieur de 2 points au taux de déclarent qu’ils sont actuellement
tion est limitée à certaines variablesSRCV. Cela peut venir de ce que l’i- indépendants. Cela vient probable-
du questionnaire. Par exempletem «pension d’invalidité» (public in- ment de ce que certains ont déclaré
l’enquêté a accepté de dire s’il perce-validity or incapacity pension) leur revenu comme «salaire» en
vait tel type de revenu mais n’a pas sun’apparaît pas comme tel dans vague 1 de SHARE, du fait que les
ou voulu répondre à la question sur leSHARE. En vague 2 l’item «Main pu- mots utilisés étaient earnings from
montant correspondant (O’Prey,blic disability insurance pension, or employment, traduit par « revenus
2009). Pour corriger la non-réponsesickness benefits» a été traduit par d’activité ». La vague 2 a précisé
partielle, on a recours à des techni-«Une assurance invalidité publique earnings from dependent employment,
ques d’imputation, qui consistent à(après accident du travail)». Cet item traduit par « revenus d’activité sa-
affecter des valeurs estimées aussiavait remplacé Public invalidity or in- lariée ».
6 Courrier des statistiques n° 129, juin 2010Christelle Garrouste, Pascal Godefroy et Anne Laferrère
proches que possible des valeurs réel- de 13 %. L’augmentation du taux de Graphique 5 - Revenus individuels
pondérésnon-réponse en vague 2 de SHAREles. Un faible taux de non-réponse
en milliers d’euros par anpartielle permet donc de limiter par rapport à la vague 1 peut encore 35
SHARE 2006 EL 2006 SRCV 2006l’usage de méthodes de redressement une fois sans doute trouver une expli-
et constitue ainsi un gage de qualité cation dans la reformulation du ques- 30
des données. Dans les enquêtes tionnaire, de «avant impôts et
25Insee, le calcul des taux de non-ré- cotisations sociales » à « nets de coti-
ponse est immédiat, comme la lo- sations sociales et autres cotisa-
20
gique du questionnement est d’abord tions », posant ici plus de difficultés
de demander la perception, ensuite d’estimations aux travailleurs indé-
15
les montants conditionnellement à la pendants qu’aux salariés auxquels on
perception. n’a pas demandé de fournir un mon- 10
tant net d’impôt.
5Concernant les salaires, la non-ré-
ponse dans SHARE vaut 17,5 % en Les taux de non-réponses partielles
0vague 1 pour ceux qui ont dit qu’ils sont donc globalement légèrement
Retraites Salaires Revenus Chômage
percevaient des revenus d’activité, plus hauts dans SHARE que dans les d’activité
non salariéecontre 9 % en vague 2 (graphique 4). autres enquêtes de l’Insee. On aurait
Source : calcul des auteurs à partir de SHARECette non-réponse est de 7,3 % dans pu penser que demander à chaque
en vague 2, de l'enquête Logement 2006 et de
SRCV et de 9,2 % dans l’enquête personne qui perçoit un revenu le SRCV 2006
Logement de 2006. Il se peut que montant correspondant contribuerait
l’amélioration inter-vagues dans à améliorer la qualité du montant tivement à celles observées dans
SHARE vienne de la reformulation de collecte formant ménage. Pourtant l’enquête revenus fiscaux et sociaux
(appariement de l’enquête Emploi etla question sur le montant des revenus ce n’est pas le cas. Cela vient proba-
d’activités de « avant impôts et cotisa- blement de ce que dans les enquêtes de sources fiscales et sociales). D’autre
tionssociales»à«netsdecotisations Insee plus d’effort est mis pour obte- part, la dimension longitudinale permet
sociales et autres cotisations ». nir l’information dans une approche en comparaison dans le temps de re-
pérer des erreurs de déclarations.plus collective, la discussion pre-
Pour les allocations chômage, condi- nant place par exemple entre les Enfin, des contrôles systématiques ont
tionnellement à la perception, les conjoints. Une autre explication été mis en place afin de repérer des er-
taux de non-réponses sont plus bas reurs courantes d’unité (francs/euros)viendrait de la longueur du ques-
dans SHARE que dans l’enquête Lo- tionnaire de SHARE, et du fait que ou de période de référence (trimes-
gement : comme on l’a vu, moins de les questions sur les revenus sont trielle/annuelle/mensuelle). Au final,
personnes mentionnent en recevoir, posées de façon désordonnée, pou- par exemple en 2007, 25 % des mon-
mais ceux qui le font donnent plus tants de retraites ont été redressés.vant ainsi paraître redondantes ou
souvent le montant. difficiles. Les remarques des enquê-
teurs après l’enquête vont dans la Nous comparons pensions moyennes,
Pour les retraites, le taux de salaires, revenus d’activité non sa-même direction : beaucoup men-
non-réponse est de 11 % dans l’en- lariée et allocations chômage non re-tionnent que les répondants n’ai-
quête Logement, de 13 % dans ment pas les questions sur les dressés, dans SHARE en vague 2, dans
SHARE vague 1 et de 15 % en vague 2. SRCV et dans l’enquête Logement derevenus dans SHARE. En d’autres
Il n’est que de 0,7 % dans SRCV. De 2006 (graphique 5). Pour les retraites, latermes, refuser des proxies pour les
nouveau, cette variation inter-vagues revenus individuels, comme le fait moyenne de SHARE est très proche de
dans SHARE tient peut-être au fait que SHARE, peut être contreproductif. celle de SRCV (14 100€ contre
la reformulation de la question sur le 14 016€). L’enquête Logement est
montant des allocations retraite de Les montants proche mais un peu en deçà. La quali-
au niveau individuel« versement moyen » à « versement té des données de SHARE paraît
ordinaire habituel » est plus difficile à bonne. Les salaires de SHARE sont
appréhender en français. Nous comparons les montants de proches de l’enquête SRCV et de l’en-
revenus. En dépit de son taux de quête Logement (23 790€ contre
non-réponse relativement bas et,Enfin, pour les indépendants, le taux 19 899€ pour SRCV et 21 569€ pour
de non-réponse dans la vague 1 de même si le répondant donne un mon- l’enquête Logement). Ainsi, la qualité
SHARE sur ce « montant de profit tant de revenu, les données de SRCV des données de SHARE parait à nou-
mensuel moyen sur les 12 derniers sont contrôlées et « nettoyées » (Rap- veau très bonne. La même conclusion
port intermédiaire sur la qualité desmois » est du même ordre que celui peut être tirée des revenus des indé-
de l’enquête Logement, alors qu’il est données françaises EU-SILC 2006). pendants. En revanche, le revenu
bien que plus élevé en vague 2. Le D’une part, des contrôles sont réalisés moyen issu des allocations de chô-
sur les valeurs extrêmes compara-taux de non-réponse dans SRCV est mage est trop bas dans SHARE.
Courrier des statistiques n° 129, juin 2010 7Validation des données françaises de l’enquête SHARE à l’aide des données externes d’autres enquêtes...
Graphique 6 - Perception d'un type de Logement que dans SRCV, sauf plus importantes sur des grands mon-
revenu en 2006 (niveau ménage) tants. Certains ont pu aussi se tromperpour les retraites, et la sous-estima-
en %
80 tion est plus importante dans de période de référence de leur re-
SHARE 2006 EL 2006 SRCV2006
SHARE (graphique 6). Ce qui n’était traite et répondre mois au lieu de tri-
70
pas ressorti au niveau individuel est mestre, alors que de nombreuses
60 plus marqué du fait de l’effet des retraites en France sont perçues tri-
conjoints manquants, certains mé- mestriellement. Il est aussi possible
50
nages n’ayant pas déclaré un sa- que certains répondants donnent le
laire, une pension, ou une allocation même montant deux fois, en incluant40
chômage. par exemple la retraite complémen-
30 taire dans la retraite de base. SRCV est
Le graphique 7 présente la distribution très précautionneux à propos de ces
20
des revenus des ménages par type de risques de doubles comptes. Ces er-
10 revenu. Le premier graphique met en reurs sont difficiles à détecter ex post.
évidence le fait que la retraite an- Elles pourraient l’être plus aisément
60
Retraites Salaires Revenus Chômage nuelle médiane des ménages dans avec des contrôles en cours de col-
d'activité
non salariée SHARE5 est élevée, à 19 696€,à lecte, que la collecte assistée par or-
Source : calcul des auteurs à partir de SHARE comparer aux 15 000€ de l’enquête dinateur permet : « avec -vous déjà
vague 2, de l'enquête Logement 2006 et de SRCV
Logement et aux 16 155€ de l’en- donné ce montant ? » ou, « donc cela2006.
quête SRCV. veut dire que vous avez en moyenne X
euros par mois ? ».
Les montants et taux Les autres quantiles des retraites sont
de perception au niveau aussi plus hauts dans SHARE que Le dernier cadran du graphique 7 pré-
des ménages dans les autres enquêtes, ce qui est sente les salaires. Le salaire annuel
probablement dû à des réponses en médian du ménage dans SHARE est
Les taux de perception des salaires, francs alors que l’on demandait des 24 000€, à comparer aux 23 400€ de
revenus d’activité non salariée, euros. Le ratio des quantiles SHARE l’enquête Logement et aux 23 306€
chômage, et retraites, définis par sur les quantiles correspondants de SRCV. Tous les quantiles sont pro-
« au moins une personne dans le SRCV augmente avec le montant de ches. Ces résultats étant produits
ménage reçoit chaque type de reve- la retraite. Cela peut signifier que les avant tout nettoyage des données de
nu », sont plus bas dans l’enquête erreurs de monnaie, ou de saisie, sont SHARE en vague 2, cela signifierait
Graphique 7 - Distributions du revenu du ménage par type de revenu
Retraites Revenus d’activité non salariée
en milliers d’euros par an en milliers d’euros par an
180 120
SHARE 2006 EL 2006 SRCV 2006 SHARE 2006 EL 2006 SRCV 2006
160
100
140
120 80
100
60
80
60 40
40
20
20
0 0
10% 25% Médiane 75% 90% 95% 99% 10% 25% Médiane 75% 90% 95% 99%
SalairesChômageen milliers d’euros par an en milliers d’euros par an
140 80
SHARE 2006 EL 2006 SRCV 2006 SHARE 2006 EL 2006 SRCV 2006
70120
60
100
50
80
40
60
30
40 20
20 10
00
10% 25% Médiane 75% 90% 95% 99% 10% 25% Médiane 75% 90% 95% 99%
Source : calcul des auteurs à partir de SHARE en vague 2, de l'enquête Logement 2006 et de SRCV 2006
8 Courrier des statistiques n° 129, juin 2010Christelle Garrouste, Pascal Godefroy et Anne Laferrère
G. Weber, 2008, Health, Ageing and Retire-que les répondants actifs plus jeunes tes et bénéfices des indépendants)
ment in Europe (2004-2007). Starting the Lon-semblent donc davantage manquersont moins enclins à faire des erreurs
gitudinal Dimension. Mannheim : Mannheim
de monnaie que leurs homologues dans SHARE que dans les autres en- Research Institute for the Economics of Aging
plus âgés percevant des retraites. Le quêtes Insee. La raison peut en être (MEA).
Börsch-Supan, A., A. Brugiavini, H. Jürges,système de retraite varie aussi davan- que la logique totale de classification
J. Mackenbach, J. Siegrist, and G. Webertage d’un pays à l’autre que le mode des revenus dans SHARE n’est pas
(eds.), 2005, Health, Ageing and Retirement in
de rémunération salarial, ce qui rend bien perçue, ni surtout bien comprise.
Europe – First Results from the Survey of Health,
une harmonisation en amont particu- Ainsi la dispersion des questions sur Ageing and Retirement in Europe, Mannheim :
Mannheim Research Institute for the Economics oflièrement délicate sur le sujet des les revenus dans tout le questionnaire
Aging (MEA).pensions de retraite. demande au répondant de répéter son
Clark, A. and A. Vicard, 2007, « Conditions
effort de mémoire. Il pourrait être utile
de collecte et santé subjective : une analyse sur
La médiane des revenus annuels d’introduire plus clairement la distinc- données européennes », Économie et Statis-
d’une activité d’indépendants dans tion entre salaires, allocations, reve- tique, 403/404, 143-163.
C. Garrouste, P. Godefroy et A. LaferrèreSHARE est de 14 400€, à comparer nus d’activité non salariée, pensions,
(2009), Validating SHARE France with otheraux 17 837€ de l’enquête Logement, loyers, et intérêts aussi bien au niveau
French Surveys, document de travail de la
et aux 17 000€ de SRCV. C’est 9,6 % individuel qu’au niveau ménage. De DSDS [à paraître].
plus bas dans SHARE, avant tout net- plus la liste des allocations devrait être O’Prey, S., 2009, La non-réponse partielle
aux variables financières de l’enquête Loge-toyage des données. Les premier et spécifique à chaque pays.
ment 2006 : Mise en œuvre de nouvelles pro-troisième quartiles sont extrêmement
cédures de redressement et comparaison de
proches entre SHARE et les autres
méthodes d’imputation.
sources. Des différences plus impor- Bibliographie
tantes apparaissent pour les premiers
Börsch-Supan, A.and H. Jürges (eds.), 2005 Theet derniers déciles. Pour les bas reve-
Survey of Health, Ageing and Retirement in Europe
nus, cela peut venir du fait que SHARE
– Methodology, Mannheim: Mannheim Research
ne permet pas de déclarer un déficit. Institute for the Economics of Aging (MEA).
Des types de revenu moins fréquents Börsch-Supan, A., A. Brugiavini, H. Jürges, http://www.insee.fr/fr/themes/docu-
A. Kapteyn, J. Mackenbach, J. Siegrist, and ment.asp?reg_id=0&id=2439.que les plus fréquents (salaires, retrai-
Courrier des statistiques n° 129, juin 2010 9

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.