Cette publication ne fait pas partie de la bibliothèque YouScribe
Elle est disponible uniquement à l'achat (la librairie de YouScribe)
Achetez pour : 28,99 € Lire un extrait

Téléchargement

Format(s) : PDF

avec DRM

Analyses factorielles simples et multiples - 5e éd.

De
400 pages
Cet ouvrage est destiné aux étudiants en Masters de mathématiques appliquées, d'économie ou d'économétrie, ainsi qu'aux élèves ingénieurs. Il aborde les méthodes d'analyse de données qui ont démontré leur efficacité dans l'étude des grandes masses complexes d'informations. Cette cinquième édition, entièrement revue et augmentée, a été enrichie de nombreux exercices corrigés.
 
 
Voir plus Voir moins
Analyses factorielles simples et multiples
Brigitte Escoer Jérôme Pagès
Analyses factorielles simplesetmultiples
Cours et études de cas
e 5 édition
Illustration de couverture :
african seamless pattern © alexvv – fotolia.com
¥ %VOPE   SVF -BSPNJHVJÍSF  1BSJT XXXEVOPEDPN *4#/ 
Introduction
1
2
Table des matières
Analyse en Composantes Principales. . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Données et objectifs de l’étude. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Transformation des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Nuage des individus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Nuage des variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Ajustement du nuage des individus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Ajustement du nuage des variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Dualité et formules de transition en ACP. . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Schéma général de l’ACP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9 Aides à l’interprétation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10 Variables qualitatives illustratives en ACP. . . . . . . . . . . . . . . . . . . . . . . . . Exercices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemple d’ACP et de CAH. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Données et problématique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Résultats de l’ACP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Introduction à la méthode de Ward (classification automatique). . . . . 2.4 Caractérisation directe d’une classe d’individus. . . . . . . . . . . . . . . . . . . . 2.5Interprétation simultanée d’un plan factoriel et d’un arbre hiérarchique 2.6 Construction et amélioration d’une partition. . . . . . . . . . . . . . . . . . . . . .
3 Analyse Factorielle des Correspondances. . . . . . . . . . . . . . . . . . . . . . . Dunod – Toute reproduction non autorisée est un délit 3.1 Données, notations, hypothèse d’indépendance. . . . . . . . . . . . . . . . . . .
1
7 7 10 11 12 13 15 17 21 24 27 30
35 35 38 46 53 59 64
67 67
vi
4
5
6
3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11
Table des matières
Objectifs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transformations des données en profils. . . . . . . . . . . . . . . . . . . . . . . . . . 2 Ressemblance entre profils : distance dux. . . . . . . . . . . . . . . . . . . . . . . Les deux nuages. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ajustement des deux nuages. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La dualité. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . Nombre d’axes et inertie totale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aides à l’interprétation et éléments supplémentaires. . . . . . . . . . . . . . . Schéma général de l’AFC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Analyse des Correspondances Multiples. . . . . . . . . . . . . . . . . . . . . . . . 4.1 Données et notations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Objectifs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 AFC appliquée à un Tableau Disjonctif Complet. . . . . . . . . . . . . . . . . . . 4.4 Analyse des Correspondances d’un tableau de Burt. . . . . . . . . . . . . . . . 4.5 Codage en classes des variables quantitatives. . . . . . . . . . . . . . . . . . . . . 4.6 Analyse Factorielle de Données Mixtes (AFDM). . . . . . . . . . . . . . . . . . . . 4.7 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Calculs et dualité en Analyse Factorielle. . . . . . . . . . . . . . . . . . . . . . . . 5.1 Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Calcul des axes d’inertie et des facteurs d’un nuage de points. . . . . . . 5.3 Nuages des lignes et des colonnes en ACP et en AFC. . . . . . . . . . . . . . 5.4 Dualité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Mise en œuvre des calculs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6 Reconstitution des données et approximation deX. . . . . . . . . . . . . . . . 5.7 Une équivalence en ACM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemple de traitement de tableau multiple par ACM et AFC. . . 6.1 L’enquête Ouest-France. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69 70 72 72 75 78 83 83 83 86
89 89 93 95 103 105 108 109 110
115 115 115 120 123 129 131 133
135 135
Table des matières
7
8
9
6.2 6.3 6.4 6.5 6.6 6.7 6.8
Analyse simultanée de plusieurs groupes de variables. . . . . . . . . . . . . . Le problème des réponses manquantes. . . . . . . . . . . . . . . . . . . . . . . . . . Première analyse : ACM des rubriques. . . . . . . . . . . . . . . . . . . . . . . . . . . Deuxième analyse : ACM du signalétique. . . . . . . . . . . . . . . . . . . . . . . . . Une analyse non satisfaisante : ACM des rubriques et du signalétique Troisième analyse : AFC du tableau croisant signalétique et rubriques Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .
L’Analyse Factorielle Multiple à partir de deux applications. . . 7.1 L’exemple des vins. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 AFM appliquée aux données de l’enquêteOuest-France. . . . . . . . . . . .
Aspects théoriques et techniques de l’Analyse Factorielle Multiple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Données et notations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . K 8.2 L’AFM dans l’espace des individusR. . . . . . . . . . . . . . . . . . . . . . . . . . . . I 8.3 L’AFM dans l’espace des variablesR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 I 8.4 L’AFM dans l’espace des groupes de variablesR. . . . . . . . . . . . . . . . . . 8.5 AFM et modèle INDSCAL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.6 Cas des variables qualitatives et des tableaux mixtes. . . . . . . . . . . . . . . 8.7 Éléments supplémentaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.8 Mise en œuvre de l’Analyse Factorielle Multiple. . . . . . . . . . . . . . . . . . . Exercice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Méthodologie de l’AFM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1 Tactique méthodologique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Aides à l’interprétation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3 Analyse factorielle multiple hiérarchique. . . . . . . . . . . . . . . . . . . . . . . . . .
10 Comparaison de tableaux de fréquence binaire. . . . . . . . . . . . . . . 10.1 Données et problèmes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dunod – Toute reproduction non autorisée est un délit des marges binaires10.2 Étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vii
136 138 140 146 150 152 155
157 157 172
179 180 181 187 196 202 206 210 212 212
215 215 221 229
233 233 238
viii
11
Table des matières
10.3 Première analyse : les tableaux en supplémentaire dans l’AFC de leur somme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Deuxième analyse : AFC de variables croisées ou de tableaux juxtaposés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Troisième analyse : analyse intra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.6 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Interprétation des résultats d’une analyse factorielle. . . . . . . . . . 11.1 Prolégomènes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Interprétation d’une ACP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Interprétation d’une AFC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4 Interprétation d’une ACM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.5 Interprétation d’une AFM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6 Quelques types de facteurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12 Deux études de cas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.1 Évaluation, sur un exemple, de l’intérêt de la transformation en rangs (AFM). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2 Huit mélodies évaluées par dix-neuf sujets. . . . . . . . . . . . . . . . . . . . . . . .
13 Fiches techniques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.1 Fiche 1 : moyenne et barycentre, variance et inertie. . . . . . . . . . . . . . . . I 13.2 Fiche 2 : représentation des variables dansR. . . . . . . . . . . . . . . . . . . . . 13.3 Fiche 3 : distance, norme et produit scalaire. . . . . . . . . . . . . . . . . . . . . .
Corrigés des exercices Chapitre 1 Analyse en composantes principales. . . . . . . . . . . . . . . . . . . . . . . . . Chapitre 4 Analyse des Correspondances Multiples. . . . . . . . . . . . . . . . . . . . . Chapitre 8 Aspects théoriques et techniques de l’Analyse Factorielle Multiple
Index systématique
Bibliographie
239
250 267 276
279 279 282 290 292 294 299
305
305 320
337 337 341 343
351 351 359 374
383
391
Introduction
L’analyse des données : outil de connaissance dans les domaines les plus divers Les méthodes d’analyse des données ont largement démontré leur efficacité dans l’étude de grandes masses complexes d’informations. Ce sont des méthodes dites multidimensionnelles en opposition aux méthodes de la statistique descriptive qui ne traitent qu’une ou deux variables à la fois. Elles permettent donc la confrontation entre de nombreuses informations, ce qui est infiniment plus riche que leur examen séparé. Les représentations simplifiées de grands tableaux de données que ces méthodes permettent d’obtenir s’avèrent un outil de synthèse remarquable. De données trop nombreuses pour être appréhendées directement, elles extraient les tendances les plus marquantes, les hiérarchisent et éliminent les effets marginaux ou ponctuels qui perturbent la perception globale des faits. Nées à l’université, elles ont d’abord été connues essentiellement des chercheurs et appliquées à des domaines scientifiques comme l’écologie, la linguistique, l’économie, etc. Elles ont permis d’aborder des études nouvelles plus riches et plus complexes. Mais leur domaine d’application déborde depuis longtemps ce cadre universitaire, surtout depuis que l’acquisition et le stockage des informations sont facilités par le développement de l’informatique. Dans tous les domaines (marketing, assurance, banque, etc.), d’importants fichiers de données sont accumulés. Le premier objectif est de conserver les informations et de pouvoir les consulter facilement. Mais on s’aperçoit vite que pour exploiter l’ensemble de l’information contenue dans ces fichiers, dont le recueil est souvent coûteux, il est nécessaire de disposer d’outils statistiques adaptés.
Puissance des représentations géométriques de l’analyse factorielle Parmi les méthodes de l’analyse des données, l’analyse factorielle tient une place primordiale. Elle est utilisée soit seule, soit conjointement avec des méthodes de classification (alors que ces dernières sont rarement appliquées seules). Cette place de choix tient en partie aux représentations géométriques des données, qui transforment en distances euclidiennes des proximités statistiques entre éléments. Elles p rmettent d’utiliser l s facul és de perception dont nous usons quotidienne-Dunod – Toute reproduction non autoriséeest un délit ment : sur les graphiques de l’analyse factorielle, on voit, au sens propre du terme
2
Introduction
(avec les yeux et l’analyse assez mystérieuse que notre cerveau fait d’une image), des regroupements, des oppositions, des tendances, impossibles à discerner directement sur un grand tableau de nombres, même après un examen prolongé. Ces représentations graphiques sont aussi un moyen de communication remarquable car point n’est besoin d’être statisticien pour comprendre que la proximité entre deux points traduit la ressemblance entre les objets qu’ils représentent.
L’analyse factorielle ou les analyses factorielles ? Les deux expressions se justifient. 1. Il existe plusieurs méthodes adaptées à différents types de données : ainsi, pour citer les plus connues, l’analyse en composantes principales (ACP) traite des tableaux croisant des individus et des variables quantitatives, l’analyse factorielle des correspondances (AFC) traite des tableaux de fréquence et l’analyse des cor-respondances multiples (ACM) s’applique à des tableaux croisant des individus et des variables qualitatives. 2.Le principe de ces méthodes est unique. Deux nuages de points, représentant respectivement les lignes et les colonnes du tableau étudié, sont construits et représentés sur des graphiques. Les représentations des lignes et des colonnes sont fortement liées entre elles.
Rigueur et souplesse des méthodes d’analyse factorielle Le fait que l’analyse factorielle ne s’applique qu’à des tableaux rectangulaires peut paraître au premier abord une limitation importante à la fois sur le type de données et sur la manière de les aborder. En réalité, la plupart des études de données peuvent être formalisées comme une analyse de tableaux rectangulaires. D’autre part, un même fichier de données peut conduire à un grand nombre de tableaux différents et donc à des analyses différentes qui permettent chacune d’étudier un des aspects du problème. La construction de tableaux à partir d’un fichier initial est appelée codage. Ce terme de codage inclut la transformation de données brutes en variables quantitatives ou qualitatives, le choix des lignes et des colonnes du tableau, celui des éléments à traiter en actif, etc. Dans cette étape de codage, la marge de manœuvre est presque infinie. Le résultat d’une analyse factorielle est unique, ce qui en assure la rigueur, mais les analyses possibles sont nombreuses, ce qui en assure la souplesse et la faculté d’adaptation.
Les tableaux multiples Les analyses factorielles ont été conçues pour étudier un tableau de données unique. Or, les personnes qui analysent des données sont de plus en plus fréquemment confrontées à l’étude simultanée de plusieurs tableaux rectangulaires. Il s’agit le plus souvent :
Un pour Un
Permettre à tous d'accéder à la lecture
Pour chaque accès à la bibliothèque, YouScribe donne un accès à une personne dans le besoin