Un indice de concordance pour l

Un indice de concordance pour l'étude comparative d'opinions sur la conjoncture

-

Documents
10 pages
Lire
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

MATHÉMATIQUES ET SCIENCES HUMAINESFARIDBENINELMICHELGRUN-REHOMMEUnindicedeconcordancepourl’étudecomparatived’opinionssurlaconjonctureMathématiques et sciences humaines,tome142(1998),p. 17-25.©Centred’analyseetdemathématiquessocialesdel’EHESS,1998,tousdroitsréservés.L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://msh.revues.org/)impliquel’accordaveclesconditionsgénéralesd’utilisation(http://www.numdam.org/legal.php).Touteutilisationcommercialeouimpressionsystématiqueestconstitutived’uneinfractionpénale.Toute copieouimpression decefichier doitcontenirla présentementiondecopyright.Article numérisé dans le cadre du programmeNumérisation de documents anciens mathématiqueshttp://www.numdam.org/17UN INDICE DE CONCORDANCE POUR L’ÉTUDE COMPARATIVESUR CONJONCTURED’OPINIONS LA Michel GRUN-REHOMME2Farid BENINEL1RÉSUMÉ. Un modèle d’indices d’association sur données binaires d’unstochastique est dans ce travail. Ce Modèle de panel d’enquêtes conjoncturelles proposé permet quan-la concordance entre deux individus et de cette concordanced’opinions comparer tifier d’une d’individus à l’autre. Des des indices découlant de ce modèle sontpaire propriétés mises en évidence.également Concordance indices for the of about eco-SUMMARY. comparative study opinions nomic climate.a model association indices based on dataIn this we stochastic binary paper, propose of These indices calculate ...

Sujets

Informations

Publié par
Nombre de visites sur la page 107
Langue Français
Signaler un problème

MATHÉMATIQUES ET SCIENCES HUMAINES
FARIDBENINEL
MICHELGRUN-REHOMME
Unindicedeconcordancepourl’étudecomparative
d’opinionssurlaconjoncture
Mathématiques et sciences humaines,tome142(1998),p. 17-25.
<http://www.numdam.org/item?id=MSH_1998__142__17_0>
©Centred’analyseetdemathématiquessocialesdel’EHESS,1998,tousdroitsréservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://msh.revues.
org/)impliquel’accordaveclesconditionsgénéralesd’utilisation(http://www.numdam.org/legal.
php).Touteutilisationcommercialeouimpressionsystématiqueestconstitutived’uneinfraction
pénale.Toute copieouimpression decefichier doitcontenirla présentementiondecopyright.
Article numérisé dans le cadre du programme
Numérisation de documents anciens mathématiques
http://www.numdam.org/17
UN INDICE DE CONCORDANCE POUR L’ÉTUDE COMPARATIVE
SUR CONJONCTURED’OPINIONS LA
Michel GRUN-REHOMME2Farid BENINEL1
RÉSUMÉ. Un modèle d’indices d’association sur données binaires d’unstochastique
est dans ce travail. Ce Modèle de panel d’enquêtes conjoncturelles proposé permet quan-
la concordance entre deux individus et de cette concordanced’opinions comparer tifier
d’une d’individus à l’autre. Des des indices découlant de ce modèle sontpaire propriétés
mises en évidence.également
Concordance indices for the of about eco-SUMMARY. comparative study opinions
nomic climate.
a model association indices based on dataIn this we stochastic binary paper, propose of
These indices calculate the concordance between two individuals and allowsurveys. opinion
to Some such indices are derived.compare pairs. properties of
1. INTRODUCTION
sont réalisées des De nombreuses enquêtes régulièrement auprès entreprises,conjoncturelles
et en France l’INSEE et la de France. des àprincipalement par Banque L’analyse réponses
d’établir un de l’économie à la fois sur le ces diagnostic enquêtes permet rapidement passé
récent et le court terme. Les émises les chefs sur la opinions par d’entreprise production,
contiennent de les les les l’information macro-ventes, prix, effectifs, l’investissement...,
sur le court terme. La des sont et concernentéconomique plupart questions qualitatives
les évolutions de ces différentes En le a le choix entre troisgrandeurs. général, répondant
évolution à la hausse niveau à la modalités : favorable, supérieur (amélioration, normale),
stabilité ou évolution à la baisse niveau inférieur à la(diminution, défavorable, (normale)
ne tiennent des effets saisonniers.Ces pas compte normale). réponses
La réalisée en france date de 1951 lespremière enquête conjoncturelle pour (1947
d’une dizaine Actuellement sont effectuées Etats-Unis). plus d’enquêtes régulièrement
différents secteurs d’activité Les dans (industrie, bâtiment, commerce, enquêtesservices).
stratifié selon sont réalisées sur un échantillon deux variables : le secteur d’activité et la
termes d’effectifs ou de chiffre taille [5].(en d’affaires)
les méthodes Pour les sont bien banalisées et utilisent à la foisenquêtes d’opinion,
multidimensionnelle et les séries Les sont l’approche temporelles. analyses toujours glob-
les des soldes ce soit à travers séries en d’opinion ales, que (différence, exprimée pourcent-
à entre les à la hausse et celles la ou des avec des sériesréponses baisse) comparaisons age,
8 rue 79000 1 Université de NiortPoitiers, IUT, Dépt. STID, Archimède,
75006 Paris2Université Paris 92 rue II, d’Assas, 18
Ces sont d’indicateurs économiques (par régression linéaire). réponses parfois pondérées
et une estimation de la est effectuée D’ailleurs lesla taille de par l’entreprise précision [3].
forcément ne sont les mêmes sur deux consécutives.répondantes pas périodes entreprises
ou La confidentialité étant Les résultats sont strates plus globalement. agrégés par par
ailleurs de rigueur.
de Box-Jenkins sont les outils deLa désaisonnalisation et la méthode principaux
des soldes dans le nécessite de désaisonnaliserd’opinion temps l’approche temporelle. L’analyse
séries L’utilisation des soldes des informations sur les tendancesles d’opinion apporte [4].
des à court terme et de faire au niveau de la consommationéconomiques permet prévisions
ou de la manufacturière.production
des individuelles ouNotre démarche est différente puisqu’elle envisage comparaisons
exactement la modélisation d’un indice de concordance entre deux d’opinion individus,plus
deux On considère un de tailles et de secteursdirigeants d’entreprise. panel d’entreprises
différents. A intervalle de lesd’activité temps régulier exemple, chaque (par trimestre),
de ces leur sur la Leresponsables entreprises expriment opinion conjoncture économique.
favorable ou défavorable choix est forcé entre un avis Pour une(en hausse) (en baisse).
le même à La à une datedonnée, responsable répond l’enquête. non-réponse entreprise
exclut le du D’autres le àdonnée, participant panel. enquêtés peuvent intégrer panel
dates.d’autres
Dans ce on s’intéresse à l’élaboration et à l’étude d’un modèle travail, stochastique
de mesurer le niveau entre différentsd’indice d’association ayant pour objet d’adéquation
individus de cette Des études similaires ont été réalisées en sciences dupopulation. déjà
aussi citer les travaux de et al. surOn qui comportement [2]. peut Snijders (1990), portent
l’étude des d’indices existant dans la ceux dûs auxpropriétés statistiques déjà littératures,
taxonomistes Une autre Roberts(Jaccard, Dice, Michener...). approche développée par
deux &#x26; Evans considère l’association entre individus comme étant la (1993) probabilité
simultanée. Il en découle comme indices d’association les estimateurs de cetted’apparition
ceux obtenus la méthode du maximum de vraisemblance.probabilité; plus précisément, par
d’association ici est La construction des indices nouvelle et les présentés possède pro-
suivantes :priétés
~ Le calcul ne se fait sur la où les individus sont dans le que période présents panel.
w Dans la concordance entre deux il est tenu du d’opinion individus, compte poids
de l’ensemble des individus du le même avis. Il est clair cettepanel ayant que
concordance entre deux individus est émettent le mêmeplus significative lorsqu’ils
fortement minoritaire dans le avis, panel.
2. LA METHODOLOGIE
= où lV et le nombre de Soient E l’ensemble des individus du card p périodespanel (E)
de recueil des données durant l’étude. Les données se donc sous la forme d’uneprésentent
= matrice de terme d’ordre où 1 si l’individu duc~2 général XZt (resp. (Xit), (N, p), 0)
favorablement à la date t.panel répond (resp. défavorablement)
cette des du fait des entréesPrécisons matrice données que peut présenter manquantes
dans à tout on associe leet des sorties le Plus e formellement, individu wi E, panel.
avec et l’ensemble des dates de de l’individue couple Xi 7ri participation (Xi, 7ri) ~0, l~pi
à l’étude. Dans cette le nombre de est dansc~2 où wi expression pi désigne périodes présent
= Si toute le l’individu est l’étude, pi p.panel. présent pendant
Il donc de construire un indice toute mesure le niveaus’agit qui, pour paire d’individus,
Il doit vérifier les de leur association. Notons M un tel axiomes de indice; symétrie (al )19
et de maximalité ci-dessous:(a2)
individus le avisDe cet indice doit être d’autant élevé deux même expriment plus plus que
autres individus le même avis est faible. Leaux mêmes dates et l’effectif des ayant que
la modèle dans cette est celui évaluant concordance d’indice, préconisé étude, d’opinions
et entre wi parVJj
de faire la où est une a intervenir taille at pondération qui pour objet Ft(resp.(resp. ,~t)
du des individus un avis favorable à la date t. Plusayant Dt) groupe (resp. défavorable)
est une fonction décroissante de et at précisément, Ft(resp. Ainsi, f3tat (resp. 3t) Dt).
l’une de l’autre. sont fonction décroissante
zNT 1 1 AF 1 1
Dans cette on choisit et de application , façon analogue
t.l’effectif du à la date Nt désigne panel
Ainsi et sont liés les relations On doncat f3t par peut
écrire l’association et la formeentre wi oejsous
1.Remarque
= La recherche d’une relation entre les a T at symétrique pondérations et 0 (ie.
= et avec T revient à choisir des fonctions d’ordreidempotentes {3t T (at) décroissante)
2. Différentes classes de telles fonctions sont Dans notre onenvisageables. application,
à la classe des fonctions de las’intéresse forcément particulièrement homographiques,
, 1 ,
avec a2 + bc &#x3E; 0. Les autres choix et via laat envisageables pour 3t
= relation introduisent une dans la des avis favorables3t dissymétrie pondération 201320132013 at -1
et défavorables simultanés.
2.Remarque
= L’association M est et où card n maxi positive majorée par Wj) qij qij
3. ÉTUDE DE LA VRAISEMBLANCE DE LA CONCORDANCE
la Deux d’individus avoir même valeur observée l’indice d’associationpaires peuvent pour
dans le très différente. D’où la avec une nécessité à la valeurpanel longévité d’adjoindre,
sa vraisemblance. Cette est très usitée chez les observée, approche concepteurs d’indices,
I.C. on citera en les travaux de Lerman particulier [6].
Pour étudier la vraisemblance d’une on la valeur observée llil association, compare Wj)
à toutes les valeurs M où constituent des de de même Y, profils réponse, type,Yj
avoir les individus et la commune de ceux Wi pendant période que qu’auraient pu wj partic-
au Il convient de définir des de même ou exactementtpanel. donc, profils type plus ipation
les de de même paires profils type.
et considérons la deNotons l’ensemble des permutations partie de f 1, 2,...., pl Aij Gp
x définie parGp Gp 20
et seront dites du même s’il existe e telLes paires (Xi, Xj) type Aij (r, r’)
= Ainsi les de même de sont cellesdonc, paires type que (Xi, Xj) (r Xi, F’Xj).
à même de sur f1 et d’un àd’un Xi 7ri profil potentiel présence que profil composées 7ri
sur le même intervalle.même de potentiel présence que Xj
ainsi défini d’établir une relation surle permet d’équivalence Remarquons que type
l’ensemble 10, 11 2p.
de même de On notera A la classe des Ce classetype que paires (Xi, Xj). type (Xi, Xj)
d’avis favorables de chacun des et être caractérisé les fréquences individus Wi peut par w~
la f1 sur Jrj période Jrj .
Indice de concordance 3.1. La variable aléatoire d’opinions
Dans le but de mesurer la vraisemblance de la concordance observée on
A s’intéresse à la variable aléatoire M définie sur (Xi, Xj) par
M constitue la valeur observée de cette Ou Ainsi, statistique; encore ,(wi, wj)
Considérons sur et à valeurs dans A l’application Aij (Xi, Xj)parfXz,Xj définie
de mesure A de la mesure et si l’on Si l’on munit la noteuniforme , (X2, Xj) image Aij
et les fonctions de des variables aléatoires M et on~M répartition
Etant donnée cette relation et des commodités de l’étude de l’indicepour présentation,
se fera en considérant comme univers l’ensemble de concordance donc
de 3.2. Les variables aléatoires Nombres concordances
la variable à tout de aléatoire e associeNF désigne qui, couple permutations T, Tl
le nombre d’avis favorables simultanés et sur la commune deexprimés par wj période wj
dans le Elle est définie présence panel. par
De définit la variable aléatoire associe on le nombre d’avisfaçon analogue, ND qui
défavorables simultanés. au nombre d’avis correspond favorables, exprimésnij
sur la Il est aisé de vérifier la relationpar w2 période (resp. 7rj.
Le domaine de de est donné l’ensembleréalisation N~ par
avis de l’un et l’autre des deux revient au mêmeune des individus, Opérer permutation
l’un et une certaine sur lesde laisser fixe les avis appliquer permutation que exprimés par
Ce résultat est formalisé le théorème avis l’autre. par ci-après.exprimés par 21
de Théorème 1. (Théorème dualité)
Preuve
n et on ar2 7ri si t e alors t e ou t e -xj par suite, 7rj
Ce d’obtenirqui permet
On donc écrirepeut
= V Il Notons E de l’ensemble des Xit, = (F te s’agit per-Gp :
laissant invariant les de l’individu sur les exterieurs àmutations positions périodes
= l’intervalle n x r2 que 7rj.Remarquons Aij Ai/j Aj/i’
Lemme 1. Soit k une réalisation de On apossible NF;
Le terme de la somme de étant de on aargument gauche, indépendant Fo,
Lemme 2. La dl’stribution de de la variable est probabilité NF l’hypergéometrique
Preuve:
une réalisation de Soit k possible NF,
1 , , / ., ,
établit :En vertu du lemme l’on 1,
Ce qui donne22
la fonction indicatrice de k.Ici désigne lI{k}
r et notons l’ensemble des à k élémentPosons simplifier Pk pour parties
de n Pour T on notera l’ensemble des à r éléments dans le7ri parties pris 7rj.
de T dans n 7ri complémentaire
On écrire :peut
l’on obtient :En intervertissant les sommes,
On montre aisément les relations suivent:qui
Par substitution dans on obtientl’expression (2),
et par suite,
Ce établit le résultat. Nqui
3.3. Distribution de l’indice de concordance
Paramètres Min et Mo,x. On donne dans ce un paragraphe l’expression, pour couple
d’individus de la valeur du minimum et du maximum de relativementquelconque, l’indice,
de de l’ensemble aux défini au 3.couples permutations paragraphe Aij
Etant donné un d’individus note E le couple E2, on wj) rangement0152(l), a(2), ..., ~(q)
ordre croissant des aux occurrences éventuellespar poids ai , a2, ..., correspondants aq (1,1)
sur les dates de L’ordre induit sur les valeurs via la relation à7ri n f3t = at ,
~t-1
savoir est un ordre décroissant. D’où les expressions,~3(1), ~i(2), ..., f3(q)
où M nombre maximum d’avis favorables simul-le (resp. m) désigne (resp. minimum)
tanés et L le nombre maximum d’avis défavorables simultanés.l) (resp. minimum)
Ainsi en divisant l’indice de donné en le maximum donné laconcordance, (1), par par
relation on obtient un indice standardisé.(4), 23
La fonction de Ce a la fonctionrépartition. paragraphe pour objectif d’expliciter
de de de l’indice concordance.répartition cP
Soit x e IR;
aOr, pour k fixé, on
Pour k on obtient
En utilisant les relations et on obtient(6) (7),
= En son donnée dans le lemme l’on obtientremplaçant par expression 2, P (NF k)
Un extension de celui en le calcul des valeurs dealgorithme, développé permet [1],
des courtes V (z) pour séquences (ie. 40).
4. EXEMPLE
On considère à titre illustratif les données mensuelles suivantes :
de On calcule la valeur observée de l’indice concordance de tout couple pris parmi
la vraisemblance la ces 5 individus du ainsi donnée fonction depar panel, que associée,
répartition.
Le tableau en la commune entre deux individusci-dessous, qui prend compte période
ces résultats :donnés, présente 24
bien sûr de la des La valeur de l’indice des deux dépend comparaison opinions individus,
la et du nombre d’avis mais aussi de la de la de taille du favorables, longueur panel période
commune. On avoir des indices et et des vraisemblancespeut proches (paires (2, 3) (2, 4) )
et différentes ou des indices différents avec des fonctions de (paires(2,3) (1, 2)) répartition
L’observation des résultats montre de de la fonction deproches. l’importance l’usage
De l’ordre induit sur les la valeur observée de l’indice n’estrépartition. plus, couples par
le même celui induit le niveau de associé etforcément par significativité pas que ((2, 5)
Par contre les et sur toutes le ont des indicespaires présentes périodes (3, 4)). (1, 5) (2, 5)
et des vraisemblances voisins pratiquement identiques.
Pour une commune le calcul de l’indice à un traitementpériode écourtée, correspond
cet indice est le même celui de la non avec des avis contraires : calculé sur laréponse que
en les données des valeurs d’avis contraires. Mais la valeur depériode totale, imputant par
la fonction de est la même des avis totalement concordants ou discordantsrépartition pour
soit la de la commune.quelque longueur période
Comme on le constater sur les données l’indice confère un niveau depeut brutes,
nul la en désaccord maximal significativité presque pour paire presque (4, 5).
5. CONCLUSION
Cette démarche a de un modèle d’indice de concordance facile cal-l’avantage proposer
dont on la ce l’étude sur des culer et connaît distribution exacte, qui permet périodes
courtes. Les résultats obtenus diffèrent de ceux fournis par l’approximation gaussienne
habituellement utilisée dans ce de type problème.
Il resterait à la loi limite de l’indice d’étendre le modèle au cas deexpliciter considéré,
de deux et au cas à n voies.possible plus réponses
Remerciements
referees Les auteurs remercient Bruno Le Calvé et les anonymes pourLeclerc, Georges
à remercier Mohammed leurs et conseils. Ils tiennent Benayadesuggestions également
l’aide pour informatique.25
BIBLIOGRAPHIE
Beninel Husson 1998. Calculation for small of the cumulative distri-F., sequences [1] F.,
bution function for of discretes statistics. particular family Computational statistics, (à
paraître).
Beninel basé 1994. Un index d’association sur des variables deV., [2] Bretagnolle F.,
à l’étude des structures sociales. of the inter-Application Proceedings présence-absences:
national and statistical Niort.Meeting" Ecology methods",
Caron Ravalet Estimation de la d’un solde N., P., Sautory O., 1996. précision d’opinion[3]
dans les de des Coll. méthodes statis-INSEE, enquêtes conjoncture auprès entreprises.
n° 9602.tiques,
Grun-Réhomme 1994. mobiles centrées et non-centrées: con-M., Ladiray D., Moyennes [4]
struction et Revue de vol. comparaison. Statistiques Appliquées (RSA), XLII, n°3, 1994.
1992. La rénovation des de coll. 32.INSEE, enquêtes conjoncture, Méthodes, n° [5]
Lerman 1981. Etude de la notion de ressemblance. Classification et ordi-I.C., analyse [6]
nale des Dunod.données,
and 1990. Distribution of some coefficients for Snijders T.A.B., al., similarity dyadic[7]
of J. 31.data in the case associated of Classification, 17,1, binary attibutes, p.5 2014
A the detection Roberts Evans 1993. method for of non random associations,[8] G., P.R.,
Behavioral and 354.Ecology Sociobiology, 15, p.349 2014