Les comparaisons internationales d'état de santé subjectif sont-elles pertinentes ? Une évaluation par la méthode des vignettes-étalons

De
Publié par

Lorsque les modalités de réponse à une question d'évaluation subjective sont utilisées différemment par des répondants, on dit que celles-ci sont affectées par un « biais d'item » ou par un effet de type DIF (Differential Item Functioning). Les réponses doivent alors être corrigées avant de pouvoir être utilisées pour formuler des hypothèses comparatives sur l'état de santé subjectif de sous-populations. Nous présentons dans ce travail une méthode de détection et de correction d'effets DIF dans les auto-évaluations de santé subjective. Cette méthode est basée sur l'évaluation par les individus d'états de santé correspondant à des situations fictives, appelées vignettes-étalons. Elle consiste à « étalonner » la réponse d'un individu à une question subjective par les évaluations qu'il fait de situations décrites dans différentes vignettes. Elle suppose que tous les individus se réfèrent à une même dimension de santé en répondant aux questions subjectives, qu'ils évaluent de façon comparable les vignettes et leur propre situation, que les vignettes puissent être ordonnées a priori et sans ambiguïté par l'analyste, selon la dimension de santé étudiée. Un biais DIF potentiel peut être identifié en comparant la répartition des évaluations des vignettes dans deux sous-groupes d'individus. Il peut être corrigé en positionnant la réponse de chaque individu à la question d'évaluation subjective par rapport à ses évaluations des situations décrites dans les vignettes. La prise en compte de problèmes de cohérence conduit à construire des intervalles d'incertitude pour les valeurs prises par la variable ainsi obtenue. La méthode proposée est illustrée par la mise en évidence d'un possible effet DIF dans l'auto-évaluation de la douleur physique, selon l'origine géographique des échantillons issus de l'enquête Share 2004, qui nous conduirait en particulier à modifier notre comparaison des états de santé subjectifs des échantillons suédois et néerlandais.
Publié le : dimanche 30 décembre 2012
Lecture(s) : 14
Tags :
Nombre de pages : 14
Voir plus Voir moins

SANTÉ
Les compar aisons internationales d’état
de santé subjectif sont-elles pertinentes ?
Une év aluation par la méthode
des vignettes-étalons
Salim Lar djane * et P aul Dour gnon **

Lorsque les modalités de réponse à une question d’év aluation subjective sont utilisées dif-
féremment par des répondants, on dit que celles-ci sont affectées par un « biais d’item »
ou par un effet de type DIF Dif( ferential Item Functioning ). Les réponses doivent alors
être corrigées avant de pouvoir être utilisées pour formuler des hypothèses comparatives
sur l’état de santé subjectif de sous-populations.
Nous présentons dans ce tra vail une méthode de détection et de correction d’effets DIF
dans les auto-évaluations de santé subjective. Cette méthode est basée sur l’évaluation
par les individus d’états de santé correspondant à des situations fi ctives, appelées vignet-
tes-étalons.
Elle consiste à « étalonner » la réponse d’un individu à une question subjective par les
évaluations qu’il fait de situations décrites dans différentes vignettes. Elle suppose que
tous les individus se réfèrent à une même dimension de santé en répondant aux questions
subjectives, qu’ils évaluent de façon comparable les vignettes et leur propre situation,
que les vignettes puissent être ordonnées a priori et sans ambiguïté par l’anal yste, selon
la dimension de santé étudiée.
Un biais DIF potentiel peut être identifi é en comparant la répartition des évaluations
des vignettes dans deux sous-groupes d’individus. Il peut être corrigé en positionnant la
réponse de chaque individu à la question d’évaluation subjective par rapport à ses éva-
luations des situations décrites dans les vignettes. La prise en compte de problèmes de
cohérence conduit à construire des intervalles d’incertitude pour les valeurs prises par la
variable ainsi obtenue.
La méthode proposée est illustrée par la mise en évidence d’un possib le effet DIF dans
l’auto-évaluation de la douleur physique, selon l’origine géographique des échantillons
issus de l’enquête Share 2004, qui nous conduirait en particulier à modifi er notre com-
paraison des états de santé subjectifs des échantillons suédois et néerlandais.
* Crest, Laboratoire de Statistique d’Enquêtes et GSF-National Research Center for Environment and Health, Institute of Biomathematics
and Biometry. Neuherberg, Allemagne
** Irdes, Institut de Recherche et Documentation en Économie de la Santé
ÉCONOMIE ET STATISTIQUE N° 403-404, 2007 165a mesure de la santé des individus est essen- une même dimension de santé. Dans ce cas, les Ltielle pour évaluer les politiques publiques. réponses obtenues ne permettent pas nécessai-
Toutefois, il n’est pas toujours possible de rement de comparer l’état de santé subjectif
mesurer les différentes dimensions de la santé des individus. Ainsi, une personne atteinte de
étudiées à l’aide de procédés de mesures physi- troubles respiratoires peut utiliser la modalité
ques ou d’avis de médecins, en raison de coûts « léger » en réponse à une question d’auto-éva-
trop élevés ou d’impossibilités pratiques. On a luation sur sa mobilité pour signifi er qu’elle ne
alors recours à des mesures subjectives de santé, pense pas parvenir à effectuer 1 km sans s’es-
typiquement obtenues à l’aide de questionnaires souffl er, alors qu’un coureur de demi-fond peut
d’auto-évaluation (Falissard, 2001). Ces der- utiliser cette même modalité « lég er » pour
niers peuvent, par exemple, être construits, lors signifi er qu’il ne pense pas parvenir à effectuer
de la conception de l’étude, en sélectionnant une ses 20 km de course hebdomadaires habituels.
ou plusieurs dimensions de santé, telles la dou- Dans une telle situation, certes extrême, les
leur physique, la mobilité, la capacité cognitive, modalités de réponse sélectionnées ne permet-
dans la classifi cation ICIDH-2 ( International tent pas de comparer la mobilité subjective des
Classification of Impairments, Disabilities and deux individus.
Handicaps) mise au point par l’OMS (W orld
Health Organization, 1980 et 1999), puis en Cet e xemple illustre le fait que les modalités de
associant à chacune d’entre elles une ou plusieurs réponse à la question d’auto-évaluation peuvent
questions d’auto-évaluation. En répondant à une être utilisées différemment par chacun et donc
question d’auto-évaluation, un individu évalue qu’elles peuvent « fonctionner » dif féremment
lui-même son état de santé, pour une dimen- selon les répondants. De façon plus formelle,
sion de santé donnée. Le questionnaire utilisé on dit alors que les modalités de réponse – les
pour l’enquête Share (cf. encadré 1) illustre items en psychométrie – sont affectés par un
cette approche. « biais d’item » ou d’un effet de type « DIF »
( Differential Item Functioning , cf. Nunnal y et
Dans le questionnaire Shar e , une question Bernstein, 1994 ; Falissard, 2001).
d’auto-évaluation est associée à chaque dimen-
sion de santé retenue et cinq modalités de La présence d’un ef fet DIF af fectant les répon-
réponse sont proposées pour chaque question ses à une question d’auto-évaluation est tou-
d’auto-évaluation. Les dimensions de santé jours une possibilité théorique mais, sans plus
considérées et les questions d’auto-évaluation d’information , cette possibilité doit êtr e écartée
correspondantes sont directement reprises des pour des raisons tant éthiques (principe d’impar-
questionnaires conçus par l’OMS pour l’ En- tialité) que scientifi ques (principe de parcimo-
quête mondiale sur la Santé 2002-2003. Dans nie). Il est donc fondé, sans plus d’information,
ce travail, nous traiterons de la question d’auto- de supposer qu’il n’y a pas d’ef fet DIF et donc
évaluation associée à la douleur physique (1) . pas de problème de comparabilité des réponses
1obtenues à une question d’auto-évaluation.
Le pr ob lème de compar a bilité des Diverses études comparatives de morbidité et
réponses dans les enquêtes de santé de santé (Murray et Chen, 1992 ; Salomon et
al. , 2004 ; Sen, 2002, entre autres) ont toutefois
Supposons que les répondants par tagent les montré que de tels problèmes de comparabilité
mêmes attentes ou une même norme de santé des réponses étaient potentiellement présents
pour une dimension de santé donnée. Dans ce dans les enquêtes sur la santé subjective, notam-
cas, on a de bonnes raisons d’avancer que deux ment lorsqu’on souhaitait comparer des échan-
individus ayant répondu par une même moda- tillons issus de pays ou régions différents pour
lité à une question d’auto-évaluation associée une ou plusieurs dimensions de santé, ce qui est
ont des niveaux de santé subjective relativement la situation typique des enquêtes effectuées sous
proches. Dans une telle situation, un individu l’égide d’organisations internationales, telles
ayant répondu « léger » à la question d’auto- l’ONU, l’OMS ou l’Union européenne. Ces tra-
évaluation précédente sur la douleur physique vaux ont également montré que l’occultation des
(cf. supra ) se perçoit en meilleure santé, de ce
point de vue, qu’un individu ayant répondu
1. Question d’auto-évaluation pour la dimension de santé « dou-« moyen » à cette même question. leur physique » (questionnaire Share 2004) : « Dans l’ensemble,
au cours des 30 derniers jours, quel niveau de douleurs physi-
ques avez-vous ressenti ? » Supposons à présent que deux répondants aient
Aucun Léger Moyen Grave Extrême
des attentes ou des normes très différentes pour ❏ ❏ ❏ ❏ ❏ 1 2 3 4 5
166 ÉCONOMIE ET STATISTIQUE N° 403-404, 2007problèmes de comparabilité des réponses pou- Le ter me vignette est utilisé en sciences socia-
vait conduire à des contresens graves sur l’état les pour désigner toute description d’une situa-
de santé des populations, notamment des plus tion fictive soumise à un individu, à laquelle on
défavorisées économiquement. Les résultats de lui demande de réagir ou qu’on lui demande
ces études, confrontés aux considérations pré- d’évaluer. L’utilisation de celles-ci remonte aux
cédentes sur l’effet DIF , plaident en faveur du années 1950, avec des travaux en anthropologie,
recueil d’informations supplémentaires en com- psychologie et sociologie, mais également en
plément des questions d’auto-évaluation lors droit et en sciences de l’éducation (Alexander
d’enquêtes de santé subjective, afi n de pouvoir et Becker, 1978 ; Salomon et al. , 2004). Des
détecter d’éventuels problèmes de comparabi- vignettes ont, par ailleurs, été récemment uti-
lité des réponses. lisées en médecine, notamment en lien avec
la formation des médecins et des infi rmiers
La méthode présentée dans ce tra vail est une (Salomon et al. , 2004).
illustration de cette approche. En exploitant
des questions complémentaires associées à la On appellera spécifi quement vignette d’ancrage
question d’auto-évaluation sur la douleur phy- ou vignette-étalon associée à une question d’auto-
sique dans le questionnaire Share , nous met- évaluation toute vignette soumise aux individus
tons en évidence, sous certaines hypothèses, un enquêtés, portant sur la même dimension de
effet DIF et montrons comment le prendre en santé que la question d’auto-évaluation, et qu’on
compte lors de comparaisons entre échantillons demande aux individus d’évaluer sur l’échelle
nationaux. utilisée pour la question d’auto-évaluation, en
réponse à une question aussi proche que possible
de celle utilisée pour l’auto-évaluation (cf. enca-
Les vignettes-étalons : un outil pour dré 2 pour les trois vignettes-étalons associées à
détecter et corriger d’éventuels problèmes la question d’auto-évaluation portant sur la dou-
de comparabilité leur physique dans le questionnaire Share ).
Ce tra vail se situe dans la continuité de méthodes Dans l’optique d’une utilisation pour détecter
récentes d’analyse et de traitement des effets DIF et corriger un effet DIF , les vignettes-étalons
dans les enquêtes de santé, développées autour et le protocole d’enquête doivent être conçus
de l’OMS et du département de Sciences politi- de façon à ce que les hypothèses suivantes puis-
ques de l’Université de Harvard depuis le début sent raisonnablement être considérées comme
des années 2000. Ces méthodes reposent sur vérifi ées.
l’inclusion d’éléments supplémentaires, appe-
lés vignettes d’ancrage Anc( horing Vignettes , H1. Hypothèse d’équivalence des vignettes :
Anc hors), que nous proposons d’appeler ég ale- tous les répondants comprennent de la même
ment vignettes-étalons , dans les questionnaires façon la situation décrite dans chacune des
de santé subjective. C’est l’intérêt récent pour vignettes.
ces méthodes et leur utilité potentielle dans
une optique de comparaisons internationales H1 signifi e que chaque vignette suffi t à décrire
qui explique que de telles vignettes aient été de façon satisfaisante une situation qui est la
incluses dans divers questionnaires de santé de même pour tous les individus enquêtés. Dans le
l’OMS et dans le questionnaire Share . cas de la douleur physique, cela revient à sup-
Encadré 1
QUELQUES ÉLÉMENTS SUR L’ENQUÊTE SHARE 2004
ET LES DONNÉES UTILISÉES
L ’enquête Share 2004 – Survey of Health, Ageing on limite le champ de l’étude aux individus enquêtés
and Retirement in Europe (Börsch-Supan et Jurges, ayant répondu à la question d’auto-évaluation sur
2005) – a été réalisée dans 11 pays européens, la douleur physique et aux questions de vignettes
donc en différentes langues. Cette enquête a été associées, lesquelles n’ont été posées que dans
explicitement conçue dans le but de répondre à des huit pays : Allemagne, Belgique, Espagne, France,
problématiques de comparaisons internationales. Grèce, Italie, Pays-Bas, Suède, avec une distinction
Les divers questionnaires nationaux ont été obtenus entre Belgique francophone et Belgique néerlando-
à partir d’un questionnaire générique en anglais, qui phone. On dispose donc fi nalement de neuf échan-
a été traduit question par question. Dans ce travail, tillons.
ÉCONOMIE ET STATISTIQUE N° 403-404, 2007 167poser que les individus évaluent bien une même tant sur l’unidimensionnalité des évaluations
situation en terme de douleur lors de l’évalua- ou la font implicitement – nous avons plutôt
tion d’une vignette. On mesure l’importance choisi de l’énoncer séparément en raison de
d’une bonne conception des vignettes et d’une l’usage qui en sera fait et de l’importance de
traduction de qualité pour que cette hypothèse l’hypothèse d’équivalence des vignettes, telle
soit approximativement vérifi ée dans le cadre qu’énoncée ci-dessus, pour les comparaisons
d’enquêtes plurilingues. inter nationales.
H2. Hypothèse d’équivalence des modalités de H3. Hypothèse d’unidimensionnalité : l’auto-
réponse : chaque répondant utilise les modali- évaluation et l’évaluation des différentes vignet-
tés de réponse de la même façon lors de l’auto- tes se rapportent à une même dimension de santé
évaluation et lors de l’évaluation des différentes pour tous les répondants.
vignettes.
Cette h ypothèse permet d’une part, de considé-
H2 autorise à comparer for mellement, à partir rer que les comparaisons formelles déduites des
des réponses obtenues, l’auto-évaluation par réponses d’un individu portent effectivement
un individu donné de son état de santé à son sur une même dimension de santé et d’autre
évaluation des différentes vignettes, et condi- part, de considérer qu’on a bien affaire à une
tionne donc pour une large part l’utilisation des même dimension de santé pour les différents
vignettes-étalons pour la mise en évidence et la répondants. Elle est fondamentale , et condi-
correction d’un effet DIF . Une bonne formula- tionne toute analyse effectuée à partir des auto-
tion de la question et des modalités de réponse évaluations et, le cas échéant, des évaluations
est essentielle pour que cette hypothèse puisse des vignettes associées.
être vérifi ée. Celle-ci n’implique pas que les
dif férents répondants utilisent les modalités de Pour ce qui concerne la douleur physique dans
réponse de la même façon, auquel cas il n’y l’enquête Share (cf. encadré 3), les hypothèses
aurait pas d’effet DIF . précédentes sont vérifi ées dans la situation où
chaque individu enquêté se « met à la place »
Divers auteurs augmentent l’hypothèse d’équi- de l’individu décrit dans chacune des vignettes
valence des vignettes d’une hypothèse por- et évalue la douleur physique correspondante,
Encadré 2
VIGNETTES ASSOCIÉES À LA DIMENSION DE SANTÉ
« DOULEUR PHYSIQUE » - QUESTIONNAIRE SHARE 2004
Pr emière vignette (vignette V ) associée à la dimen- Question associée :1
sion de santé douleur physique dans le cadre de l’en-
En général, au cours des 30 derniers jours, quel niveau quête Share 2004.
de douleurs physiques Henri a-t-il éprouvé ?
V : Paul a un mal de tête une fois par mois qui diminue Aucun Léger Moyen Grave Extrême 1
après qu’il ait pris un cachet. Pendant qu’il a mal à la
1 2 3 4 5
tête, il peut mener ses activités quotidiennes.
T roisième vignette (vignette V ) associée à la dimen-3
Question associée : sion de santé douleur physique dans le cadr e de l’en-
quête Share 2004.
En général, au cours des 30 derniers jours, quel niveau
de douleurs physiques Paul a-t-il éprouvé ? V : Charles a mal aux genoux, aux coudes, aux poi-
3
gnets et aux doigts, et la douleur est presque conti-
Aucun Léger Moyen Grave Extrême nuellement présente. Bien que les médicaments

1 2 3 4 5 aident, il ne se sent pas bien lorsqu’il se déplace, qu’il
tient ou soulève quelque chose.
Deuxième vignette (vignette V ) associée à la dimen- 2
sion de santé douleur physique dans le cadr e de l’en- Question associée :
quête Share 2004.
En général, au cours des 30 derniers jours, quel niveau
V : Henri a mal dans tout son bras droit et son poignet de douleurs physiques Charles a-t-il éprouvé ? 2
pendant sa journée de travail. Cela est partiellement
Aucun Léger Moyen Grave Extrême
atténué la soirée lorsqu’il ne travaille plus devant l’or-
dinateur. 1 2 3 4 5
168 ÉCONOMIE ET STATISTIQUE N° 403-404, 2007et uniquement la douleur physique corres- Les h ypothèses précédentes suffi sent à justifi er
pondante, comme si c’était lui-même qui la l’utilisation des vignettes-étalons pour la détec-
subissait. tion d’un ef fet DIF. Lorsqu’il y a plus d’une
Encadré 3
DÉFINITION D’UNE VERSION DES AUTO-ÉV ALUATIONS
CORRIGÉE DE L’EFFET DIF
POUR LES RÉPONDANTS DONT LES RÉPONSES SONT COHÉRENTES
– DIMENSION DE SANTÉ « DOULEUR PHYSIQUE » - SHARE 2004
La réponse à la question d’auto-évaluation possède évaluation et l’une des vignettes associées ; le rang
cinq modalités sur une échelle ordinale. À chaque indi- de cette dernière dans la série de vignettes ordonnée
vidu i, on soumet tr ois vignettes à évaluer sur la même par gravité strictement croissante est C( i)/2. Si C( i ) est
échelle (cf. encadré 2). impair , cela signifi e que la modalité sélectionnée en
réponse à la question d’auto-évaluation n’a été rete-
L ’auto-évaluation de l’individu i est notée Y( i ). nue pour aucune des vignettes ; l’état de santé subjec-
L’évaluation de la vignette j par l’individu i est notée tif de l’individu se positionne, en termes de rang dans
Z ( i, j). Les vignettes associées à la question d’auto- la série des vignettes ordonnée par gravité strictement
évaluation sont numérotées de V à V par niveau de croissante, entre ( C( i) - 1)/2 et ( C ( i) + 1)/2. 1 3
gravité strictement croissant, selon l’ordre privilégié
V < V < V . À titre d’illustration, comparons l’état de santé sub-1 2 3
jectif de deux individus dont les réponses sont cohé-
Avec cette convention, les réponses de l’individu i sont rentes, ayant tous deux déclaré un niveau de douleur
cohérentes si et seulement si Z( i,1) < Z ( i ,2) < Z( i ,3). physique « moyen ».
Si c’est le cas, on pose Soit i un répondant pour lequel Y( i ) = « moyen » et
pour lequel Z( i,1) = « léger », Z ( i,2) = « grave » et C( i ) = 1 si Y( i) < Z( i,1)
Z ( i ,3) = « extrême ». Comme Z ( i,1) < Z( i,2) < Z( i,3), les
C( i ) = 2 si Y( i ) = Z ( i ,1) réponses de l’individu i sont cohér entes. D’autre part,
comme Z ( i,1) < Y ( i) < Z( i ,2), on a C ( i) = 3. C( i ) = 3 si Z ( i,1) < Y( i ) < Z ( i ,2)
C ( i) = 4 si Y ( i ) = Z ( i ,2) Soit par ailleurs m un répondant pour lequel
Y( m ) = « moyen » et pour lequel Z ( m,1) = « léger », C ( i) = 5 si Z ( i ,2) < Y( i) < Z( i ,3)
Z( m ,2) = « moyen » et Z( m,3) = « extrême ». Comme
C ( i ) = 6 si Y( i ) = Z( i,3) Z( m ,1) < Z( m ,2) < Z( m,3), les réponses de l’individu
C ( i ) = 7 si Y ( i ) > Z( i,3) m sont également cohérentes. D’autre part, comme
Y ( m ) = Z( m,2), on a C ( m) = 4.
C est donc une variable or dinale à 7 modalités. Plus
généralement, si on avait eu J vignettes, on aurait pu On en déduit que le niveau de douleur physique r es-
construire de la même façon une variable ordinale senti par m est plus élevé que le niveau de douleur
ayant 2 J + 1 modalités. physique ressenti par i, bien qu’ils aient tous deux
répondu de la même façon à la question d’auto-éva-
Si C ( i) est pair, cela signifi e que la même modalité de luation sur la douleur physique.
réponse a été sélectionnée pour la question d’auto-
Tableau A
Deux cas de cohérence
Aucun Léger Moyen Grave Extrême
Pr emier cas
Réponse à la question de l’enquête
Share Y ( i)
Réponse à la pr emière vignette V Z ( i,1) 1
Réponse à la deuxième vignette V Z ( i ,2) 2
Réponse à la tr oisième vignette V Z ( i,3)
3
V aleur de C( i ) C ( i) = 3
Deuxième cas
Réponse à la question de l’enquête
Share Y ( m)
Réponse à la première vignette V Z( m ,1)
1
Réponse à la deuxième vignette V Z ( m ,2) 2
Réponse à la tr oisième vignette V Z ( m,3) 3
V aleur de C ( m C ( m ) = 4
C( i ) < C( m) : l’individu i est en meilleur e santé subjective que l’individu m pour la dimension de santé considérée.
ÉCONOMIE ET STATISTIQUE N° 403-404, 2007 169vignette-étalon, on doit toutefois leur adjoindre pour la conception d’instruments de mesure
une hypothèse supplémentaire dans l’optique subjectives restent valables ici (Falissard, 2001,
d’une correction de l’ef fet DIF. Notons k le par exemple). On verra par ailleurs comment
nombre total de vignettes ( k > 1). étudier la pertinence des hypothèses de travail à
l’aide d’outils statistiques et, de façon connexe,
H4. Hypothèse d’ordre privilégié : les k vignet- comment prendre en compte les répondants
tes sont strictement ordonnées pour la dimension dont les évaluations des vignettes ne sont pas
de santé considérée, selon V < V < … < V par cohérentes avec l’hypothèse H4, lors de la cor-
1 2 k
ordre de gravité strictement croissant. rection d’un effet DIF .
Ainsi, pour la douleur ph ysique dans l’enquête
Détecter un pr oblème de comparabilité Share, nous ferons l’h ypothèse que V < V < V 1 2 3
(pour les défi nitions des vignettes V à V , cf. en-1 3
Les vignettes-étalons peuvent être utilisées pour cadré 2). Nous verrons que cet ordre, qui peut
détecter un ef fet DIF entre indi vidus ou entre sembler assez naturel, n’est pas partagé par tous
groupes d’individus. En effet, sous les hypothè-les répondants.
ses H1, H2, H3, il suffi t, pour mettre en évidence
un effet DIF et donc un prob lème de comparabi- L’ordre strict mentionné dans l’hypothèse H4
lité des auto-évaluations entre deux répondants, sera appelé ordre privilégié. P our éviter une
de comparer les modalités de réponse utilisées trop grande instabilité des résultats obtenus, il
pour l’évaluation des différentes vignettes. est souhaitable qu’il y ait consensus des indi-
Si deux individus répondent dif féremment à vidus enquêtés, des analystes, d’experts ou des
la question associée à une même vignette , les utilisateurs de l’enquête sur l’ordre privilégié
hypothèses d’équivalence des vignettes et des vignettes ; en l’absence d’un tel consensus,
d’équivalence des modalités de réponse impli-on doit faire face à de très diffi ciles problèmes
quent qu’ils utilisent différemment les modali-d’agrégation des préférences, classiques en
tés de réponse lors de l’auto-évaluation ; leurs sciences politiques et économiques. Cet aspect,
santés subjectives ne peuvent alors être directe-peu abordé dans la littérature sur les vignettes-
ment comparées à partir de leurs réponses à la étalons, nous semble être une limitation impor-
question d’auto-évaluation .tante de la méthodologie proposée, qui peut
nuire à la crédibilité de l’analyse, en particu-
De façon analogue, sous les hypothèses H1, H2 lier dès lors que le nombre de vignettes est trop
et H3, il suffi t, pour mettre en évidence un effet élevé. En effet, nous verrons que la procédure
DIF entre sous-populations, de comparer les proposée pour corriger l’effet DIF repose de
fréquences relatives d’utilisation des différentes façon essentielle sur le fait que les évaluations
modalités de réponse utilisées à l’issue de l’éva-des vignettes par les répondants soient cohéren-
luation des différentes vignettes dans chaque tes avec l’hypothèse H4, ce qui requiert en par-
sous-population.ticulier que des niveaux de santé suffi samment
distincts soient associés aux différentes vignet-
Les réponses obtenues pour chacune des vignet-tes. Il y a donc un arbitrage à effectuer, lors de
tes associées à la question d’auto-évaluation la conception du questionnaire, entre le nombre
portant sur la douleur physique dans le ques-de vignettes à inclure et une différenciation suf-
tionnaire Share per mettent d’illustrer cette uti-fi sante de celles-ci.
lisation des vignettes-étalons (cf. graphiques I
à III). À notre sens, celle-ci suffit à elle seule Les h ypothèses ci-dessus décrivent des situa-
à justifier l’inclusion de vignettes-étalons dans tions idéales ; on peut donc diffi cilement s’at-
des questionnaires comprenant des questions de tendre à ce qu’elles soient vérifi ées exactement
santé subjective. dans la pratique. Une validité approximative est
toutefois souvent suffi sante et divers arguments
Ainsi, il e xiste une différence importante d’uti-en faveur de celle-ci sont fournis par Salomon
lisation des modalités de réponse à l’évaluation et al. (2000 et 2002), King et al. (2004) et King
du cas décrit par la vignette V , entre l’échan- et Wand (2007). On mesure l’impor tance de la 1
tillon suédois d’une part et les échantillons néer-conception des vignettes et des modalités d’en-
landais, belge néerlandophone et grec d’autre quête et la nécessité de tester les vignettes avant
part (cf. graphique I).toute utilisation à grande échelle ; diverses
recommandations pratiques sont fournies par
Salomon et al. (2000). De plus, la plupar t des Une différence importante apparaît dans le cas
recommandations données dans la littérature de la vignette V , entre l’échantillon suédois 2
170 ÉCONOMIE ET STATISTIQUE N° 403-404, 2007
d’une part et les autres échantillons d’autre Ces constats suggèrent très for tement l’e xis-
part (cf. graphique II). La même différence tence d’un effet DIF entre échantillons et donc
est observée dans le cas de la vignette V un problème de comparabilité des auto-évalua-3
(cf. graphique III). tions obtenues, notamment entre l’échantillon
suédois et les autres échantillons. La crédibilité
de cette conclusion repose essentiellement sur
Graphique I
celle des hypothèses d’équivalence des vignet- Première vignette associée à la douleur
tes et d’équivalence des modalités de réponse. physique
L’hypothèse d’ordre privilégié H4 n’est, quant à
La répartition par échantillon des modalités de
elle, pas utilisée à ce stade de l’analyse.réponse
Suède
Pays-Bas Corriger les auto-évaluations pour
Italie améliorer la comparabilité
Grèce
Une conséquence impor tante des hypothèses France
d’équivalence des vignettes, d’équivalence des Espagne
modalités de réponse et d’unidimensionnalité Allemagne
Belgique est que le positionnement de l’auto-évaluation
néerlandophone
d’un répondant par rapport à ses évaluations Belgique
francophone
des vignettes associées n’est pas af fecté par l’ef-
0 10 20 30 40 50 60 70 80 90
En % fet DIF et peut donc être déduit de ses répon-
ses. Ce positionnement peut alors être utilisé
Aucun Léger Moyen Grave Extrême
pour effectuer des comparaisons entre indivi-
Lecture : répartition, en cinq modalités, des réponses à la ques-
tion de la Première vignette associée au domaine de santé douleur dus. En effet, un individu évaluant son état de
physique dans le cadre de l’enquête Shar e 2004. « Paul a un mal santé avec une modalité supérieure (en gravité)
de tête une fois par mois qui diminue après qu’il ait pris un cachet.
à celle utilisée pour une vignette V donnée est Pendant qu’il a mal à la tête, il peut mener ses activités quotidien- j
nes. En général, au cours des 30 derniers jours, quel niveau de en moins bonne santé subjective qu’un individu
douleurs physiques Paul a-t-il éprouvé ? » (cf. encadré 3).
dont les évaluations des vignettes sont dans le Champ : ensemble des individus ayant répondu à la question
d’auto-évaluation et aux questions de vignettes associées pour même ordre que celles de l’individu précédent
la dimension de santé « douleur physique ».
Source : enquête Share , 2004.
Graphique III
Graphique II Troisième vignette associée à la douleur
Deuxième vignette associée à la douleur physique
physique
La répartition par échantillon des modalités de
La répartition par échantillon des modalités de réponse
réponse
Suède
Suède
Pays-Bas
Pays-Bas
Italie
Italie
Grèce
Grèce
France
France
Espagne
Espagne
Allemagne
Allemagne
Belgique
néerlandophoneBelgique
néerlandophone Belgique
francophoneBelgique
francophone 0 10 20 30 40 50 60 70 80
0 10 20 30 40 50 60 70 En %
En %
Aucun Léger Moyen Grave Extrême

Aucun Léger Moyen Grave Extrême
Lectur e : répartition, en cinq modalités, des réponses à la ques-
tion de la Troisième vignette associée au domaine de santé dou- Lecture : répartition, en cinq modalités, des réponses à la ques-
tion de la Deuxième vignette associée à la dimension de santé leur physique dans le cadre de l’enquête Share 2004. « Charles
douleur physique dans le cadre de l’enquête Share 2004. « Henri a mal aux genoux, aux coudes, aux poignets et aux doigts, et
a mal dans tout son bras droit et son poignet pendant sa jour- la douleur est presque continuellement présente. Bien que les
médicaments aident, il ne se sent pas bien lorsqu’il se déplace, née de travail. Cela est partiellement atténué la soirée lorsqu’il
ne travaille plus devant l’ordinateur. En général, au cours des 30 qu’il tient ou soulève quelque chose. En général, au cours des
derniers jours, quel niveau de douleurs physiques Henri a-t-il 30 derniers jours, quel niveau de douleurs physiques Charles a-
éprouvé ? » (cf. encadré 3). t-il éprouvé ? » (cf. encadré 3).
Champ : ensemble des individus ayant répondu à la question Champ : ensemble des individus ayant répondu à la question
d’auto-évaluation et aux questions de vignettes associées pour d’auto-évaluation et aux questions de vignettes associées pour
la dimension de santé « douleur physique ». la dimension de santé « douleur physique ».
Source : enquête Share , 2004. Source : enquête Share , 2004.
ÉCONOMIE ET STATISTIQUE N° 403-404, 2007 171et qui évalue son état de santé avec une modalité Dans la situation idéale où l’ordre sur les
inférieure (en gravité) à celle utilisée pour cette vignettes qui est déduit d’une comparaison
même vignette V . de leurs évaluations est le même pour tous les j
Encadré 4
DÉFINITION D’UN INTER VALLE D’INCERTITUDE
POUR L ’AUTO-ÉVALUATION CORRIGÉE DE L’EFFET DIF
– DIMENSION DE SANTÉ « DOULEUR PHYSIQUE » - SHARE 2004
À la suite de King et Wand (2007), nous pouvons en respondrait à peu près à celui décrit dans la vignette
général obtenir, pour chaque individu i dont les répon- de rang r( i , +).
ses ne sont pas cohérentes, un ensemble non vide G( i )
Pour un individu i dont les réponses sont cohér entes, de vignettes-étalons susceptibles d’être équivalentes
on pose C ( i, -) = C( i, +) = C( i). à la situation de l’individu i pour la dimension de santé
considérée.
À titre d’illustration, soit i un répondant tel que
Y ( i ) = « moyen », Z( i,1) = « moyen », Z( i,2) = « léger », Convenons de noter , r ( i , -) le rang, dans la série des
Z ( i,3) = « grave ». Comme Z ( i ,2) < Z( i,1), les réponses vignettes ordonnées selon l’ordre privilégié de la
de l’individu ne sont pas cohérentes. La procédure vignette élément de G( i ) correspondant à l’état de
présentée par King et Wand (2007) permet d’obtenir santé le moins grave et r ( i , +) le rang, dans la série
G( i) = { V , V }, c’est-à-dire que V et V sont toutes des vignettes ordonnée selon l’ordre privilégié, de 1 2 1 2
deux susceptibles de correspondre à la situation de la vignette élément de G ( i) corr
l’individu i en termes de niveau de douleur physique. santé le plus grave.
On en déduit r ( i, -) = 1, r( i , +) = 2, d’où C ( i, -) = 2 et
On pose alors C ( i, -) = 2 r ( i , -) et C ( i, +) = 2 r( i , +). C ( i , +) = 4.
C( i , -) correspond à la valeur de C qui serait associée à Une présentation détaillée et illustrée de la procédure
un individu i dont les réponses seraient cohér entes et d’obtention de G( i) est donnée dans King et W and
dont l’état de santé pour la dimension considérée cor- (2007) et une implémentation informatique de celle-ci
respondrait à peu près à celui décrit dans la vignette est disponible dans le package « anchors » du logiciel
de rang r( i , -). R développé par King et W and (2005), que nous avons
utilisé et adapté aux besoins de notre étude. King et
C( i, +) correspond à la valeur de C qui serait associée à Wand (2007) proposent également une méthode per-
un individu i entes et mettant de traiter le cas des individus pour lesquels - l’ensemble G( i ) est vide.
Tableau A
Deux cas d’incohér ence
Pr emier cas : cas où la procédure de King et Wang conduit à ne pas retenir la vignette V 3
Aucun Léger Moyen Grave Extrême
Réponse à la question de l’enquête Share Y( i)
Réponse à la pr emière vignette V Z ( i,1) 1
Réponse à la deuxième vignette V Z( i,2) 2
Réponse à la tr oisième vignette V Z ( i ,3) 3
V aleur de r ( i , -) (rang de V ) 1
1
Vr( i, +) (rang de V 2
2
Valeur de C ( i , -) (évaluation « optimiste ») 2
VC( i , +) (évaluation « pessimiste ») 4
Deuxième cas : cas où la pr océdure de King et Wang conduit à ne pas retenir la vignette V
1
Aucun Léger Moyen Grave Extrême
Réponse à la question de l’enquête Share Y ( m )
Réponse à la pr emière vignette V Z ( m,1)
1
Réponse à la deuxième vignette V Z ( m,2)
2
Réponse à la troisième vignette V Z ( m,3) 3
V aleur de r( m , -) (rang de V ) 2 1
Vr( m , +) (rang de V 3 2
Valeur de C( m , -) (évaluation « optimiste ») 4
V C ( m, +) (évaluation « pessimiste ») 6
172 ÉCONOMIE ET STATISTIQUE N° 403-404, 2007répondants, il est possible de comparer l’état de façon originale dans ce travail. Il s’agit d’une
santé de deux répondants quelconques. Lorsque solution qui n’est pas exempte de critique mais
c’est le cas, on peut naturellement adopter cet qui permet à tout le moins de mettre en évidence
ordre commun comme ordre privilégié dans et de quantifi er l’infl uence des problèmes de
l’hypothèse H4. Dans le cas plus général, et consistance sur l’issue de l’analyse.
plus réaliste, où l’ordre privilégié n’est pas un
ordre partagé par l’ensemble des répondants, on L’idée développée par King et Wand (2007)
introduit la notion. consiste à identifi er, pour chaque individu i
dont les réponses ne sont pas cohérentes, un
On introduit la notion de consistance : par ensemble G ( i ) de vignettes susceptibles d’être
souci de concision, les réponses d’un individu équivalentes à la situation de l’individu i pour la
enquêté seront qualifi ées simplement de cohé- dimension de santé considérée (cf. encadré 4).
rentes si l’évaluation qu’il fait des vignettes est Une présentation détaillée et illustrée de la pro-
cohérente avec l’hypothèse H4 c’est-à-dire si cédure d’obtention de G ( i) est donnée dans King
elle respecte l’ordre privilégié. et Wand (2007) et une implémentation informa-
tique de celle-ci est disponible dans le package
Un indi vidu dont les réponses sont cohérentes « anchors » du logiciel R dév eloppé par King et
et qui évalue son état de santé à l’aide d’une Wand (2005), que nous avons utilisé et adapté
modalité strictement supérieure (en gravité) aux besoins de notre étude.
à celle utilisée pour une vignette donnée, est
en moins bonne santé subjective qu’un indi- Nous utilisons les ensemb les G (.) et la varia-
vidu dont les réponses sont cohérentes et qui ble C pour défi nir, pour chaque répondant i , un
évalue son propre état de santé à l’aide d’une couple de valeurs ( C ( i , —), C ( i , +)) décrivant le
modalité strictement inférieure (en gravité) à résultat de son auto-évaluation relativement aux
celle utilisée pour cette même vignette, et ce différentes vignettes.
indépendamment de la population à laquelle
il appartient . Dans ce type de comparaisons, L ’introduction des v ariab les C (., -) et C (., +) est
les vignettes sont utilisées comme des étalons à notre connaissance, spécifi que à notre travail.
ou points d’ancrage permettant de comparer Nous proposons d’interpréter C (., -) comme
les auto-évaluations. Afi n de systématiser cette une évaluation optimiste de la santé subjective
approche, King et al. (2004, 2007) proposent de de l’individu i et C ( i , +) comme une évaluation
défi nir, sous les hypothèses H1 à H4 et pour les pessimiste de la santé subjective de l’individu i .
répondants dont les réponses sont cohérentes, On dispose ainsi d’un intervalle ordinal d’incer-
une variable numérique ordinale C traduisant le titude sur l’état de santé subjectif de chaque indi-
positionnement de l’auto-évaluation par rapport vidu , que ses réponses soient cohérentes ou non.
aux évaluations des vignettes (cf. encadré 3).
La variable ainsi obtenue peut être interprétée Les v ariab les C (., -) et C (., +) ainsi défi nies peu-
comme une version de l’auto-évaluation corri- vent alors être utilisées pour obtenir, pour chaque
gée non paramétriquement de l’effet DIF , c’est- population et chaque vignette V , un intervalle j
à-dire sans recours à une modélisation aléatoire d’incertitude pour la propor tion d’individus éva-
paramétrique du comportement de réponse des luant leur état de santé équivalent ou meilleur
individus (King et al. , 2004 et 2007). que celui décrit dans la vignette V et un inter-
j
valle d’incertitude pour la proportion d’individus
évaluant leur état de santé équivalent ou moins La v ariab le C peut être utilisée de f açon très sim-
bon que celui décrit dans la vignette V (cf. enca-ple pour comparer l’état de santé de deux répon- j
dants dont les réponses sont cohérentes. Par dré 5). Les intervalles obtenus pour diverses sous-
exemple, si C ( i ) < C ( j ), il est cohérent d’affi rmer populations peuvent alors être comparés à l’aide
que l’individu i est en meilleur santé subjective d’outils exploratoires, notamment graphiques.j pour la dimension de santé consi-
Il est, à ce stade, impor tant de noter que cette dérée. Une limite évidente de cette approche est
construction et son interprétation sont relatives que C n’est défi nie que pour les répondants dont
à l’ordre privilégié et qu’elles peuvent donc être les réponses sont cohérentes et, par conséquent,
critiquées sur cette base. Nous verrons toutefois ne permet pas d’effectuer des comparaisons
que le fait d’obtenir des intervalles d’incertitude d’état de santé subjectif entre sous-populations
comprenant des répondants dont les réponses ne permet de quantifier l’importance des problè-
sont pas cohérentes. Afi n de pallier ces incon- mes de non-consistance lors de comparaisons
vénients, King et Wand (2007) proposent une entre sous-populations et donc de mettre en évi-
approche plus générale, que nous adaptons de dence l’ampleur des écarts potentiels aux hypo-
ÉCONOMIE ET STATISTIQUE N° 403-404, 2007 173thèses de travail, ce qui permettra de relativiser des autres comparaisons entre échantillons ne
certains résultats obtenus. permet de suggérer de différence signifi cative,
les différents intervalles d’incertitude se recou-
vrant partiellement les uns les autres. Dans le
Compar er l’état de santé de sous- cas de l’échantillon italien, cette conclusion doit
populations : une application encore être relativisée par l’importance des pro-
de la méthode aux échantillons Share blèmes de consistance.
Illustrons l’utilisation de ces intervalles d’in- La proportion d’individus évaluant leur état de
certitude par une comparaison des échantillons santé équivalent ou moins bon que celui décrit
Shar e par origine, pour la dimension de santé
douleur physique.
Graphique IV L’échantillon suédois se distingue clairement
Proportion par échantillon de ceux qui des autres échantillons par une proportion plus
évaluent, du point de vue de la douleur élevée d’individus évaluant leur état de santé
physique, leur état de santé équivalent
équivalent ou meilleur que celui décrit dans la ou meilleur que l’appréciation qui est la leur
vignette V et par une incertitude très faible. du cas décrit dans la première vignette1
L ’échantillon néerlandais se distingue également En %
100
de la plupart des autres échantillons, mais pas de
90
l’échantillon italien, caractérisé par une incerti-
80tude très importante, donc par des problèmes de
70consistance importants (cf. graphique IV).
60
50L ’examen des proportions d’individus évaluant
leur état de santé équivalent ou meilleur que celui 40
décrit dans la vignette V (cf. encadré 2) pour ce
2
qui concerne la douleur physique conduit à des
conclusions analogues (cf. graphique V).

Lecture : en Grèce, 58 % des répondants évaluent leur état de
On remar que que l’échantillon suédois se dis- santé meilleur (du point de vue de la douleur physique) que
l’évaluation qu’ils font du cas présenté dans la première vignette tingue par la proportion la plus élevée d’indi-
associée au domaine de santé douleur physique dans le cadre de
vidus évaluant leur état de santé équivalent ou l’enquête Shar e 2004 : « Paul a un mal de tête une fois par mois
qui diminue après qu’il ait pris un cachet. Pendant qu’il a mal à meilleur que celui décrit dans la vignette V et
2 la tête, il peut mener ses activités quotidiennes. En général, au par une incertitude très faible. On peut égale- cours des 30 derniers jours, quel niveau de douleurs physiques
Paul a-t-il éprouvé ? » (cf. encadré 3). L’existence de cas de non-ment avancer que la proportion d’individus éva-
cohérence conduit à définir un intervalle d’incertitude allant de
luant leur état de santé équivalent ou meilleur 53 % à 64 % (cf. encadrés 5 et 6).
Champ : ensemble des individus ayant répondu à la question que celui décrit dans la vignette V est plus éle-
2 d’auto-évaluation et aux questions de vignettes associées pour vée au sein de l’échantillon néerlandais qu’au la dimension de santé « douleur physique ».
Source : enquête Shar e , 2004. sein de l’échantillon grec. Par contre, aucune
Encadré 5
DÉFINITION DES INTERVALLES D’INCERTITUDES (PROPORTIONS)
Notons F( x, -) la proportion d’individus pour lesquels Notons G( x , -) la proportion d’individus pour lesquels
pr end une valeur inférieure ou égale à x et pr end une valeur supérieure ou égale à x et
F ( x, +) la proportion d’individus pour lesquels G( x , +) la proportion d’individus pour lesquels
pre ou égale à x dans l’une pre ou égale à x dans l’une
des sous-populations considérées. Alors, pour toute des sous-populations considérées. Alors, pour toute
vignette V , l’intervalle est vignette V , l’intervalle
j j
un intervalle d’incertitude pour la pr oportion d’indi- est un intervalle d’incertitude pour la proportion d’in-
vidus dont l’état de santé subjectif est équivalent ou dividus dont l’état de santé subjectif est équivalent ou
meilleur que celui décrit dans la vignette V . moins bon que celui décrit dans la vignette V .
j j
174 ÉCONOMIE ET STATISTIQUE N° 403-404, 2007
Belgique
francophone
Belgique
néerlandophone
Allemagne
Espagne
France
Grèce
Italie
Pays-Bas
Suède

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.