Analyses statistiques multivariées descriptives

De
Publié par

CHAPITRE VII Analyses statistiques multivariées descriptives 1. Introduction • L'objectif principal des analyses descriptives multivariées est d'étudier ou de décrire un ensemble de variables prises globale- ment. • Cette étude permet de synthétiser et de visualiser rapidement une grande quantité d'information. • Elles reposent sur un examen des interdépendances entre toutes les variables. 2. Analyses factorielles Objectifs Les analyses factorielles visent toutes les mêmes objectifs : • Représenter en 2 ou 3 dimensions des données multidimension- nelles. • Pour cela, concéder une perte d'information qui devra être me- surée. On perd en information pour gagner en signification. Différentes méthodes factorielles La méthode choisie dépendra du type des variables : • Analyse en Composantes Principales (ACP) : variables quantita- tives. • Analyse des Correspondances (AFC) : deux variables qualitatives. • Analyse des Correspondances Multiples : plusieurs variables qua- litatives et/ou quantitatives. Principe des analyses factorielles Les données sont représentées graphiquement dans un espace à n dimensions : x 1 1 x 1 2 x 1 3 X 1 Y 1 Y 2 Y 3 Elles sont ensuite projetées dans un espace à 2 ou 3 dimensions : Cette projection entraîne une perte d'information : qu'il faudra mesurer et minimiser.

  • qualité

  • principe des analyses factorielles

  • nominal par nominal phi

  • inertie du nuage

  • nouvelles variables

  • epson p890

  • epson c40ux

  • représentation graphique des profils-lignes

  • duree

  • analyse factorielle


Publié le : mardi 19 juin 2012
Lecture(s) : 187
Source : unilim.fr
Nombre de pages : 9
Voir plus Voir moins
CHAPITRE VII Analyses statistiques multivarièes descriptives
1. Introduction
• L’objectif principal des analyses descriptives multivaries est d’tudier ou de dcrire un ensemble de variables prisesglobale-ment. • Cette tude permet desynthÉtiseret devisualiserrapidement une grande quantit d’information. • Elles reposent sur un examen desinterdÉpendancesentre toutes les variables.
2. Analyses factorielles
Objectifs Les analyses factorielles visent toutes les mmes objectifs :
ReprÉsenteren 2 ou 3 dimensions des donnes multidimension-nelles. • Pour cela, concder uneperte d’informationqui devra tre me-sure. On perd en information pour gagner en signification.
Diffèrentes mèthodes factorielles La mthode choisie dpendra du type des variables : Analyse en Composantes Principales (ACP): variables quantita-tives. Analyse des Correspondances (AFC): deux variables qualitatives. Analyse des Correspondances Multiples: plusieurs variables qua-litatives et/ou quantitatives.
Principe des analyses factorielles Les donnes sontreprÉsentÉesgraphiquement dans un espace Àn dimensions :
Elles sont ensuite projetes dans un espace À2 ou 3dimensions :
Cette projection entraïne uneperte d’information:
qu’il faudramesureret minimiser. Inertie Pour mesurer la perte d’information, on utilise l’inertiequi mesure l’Étalement du nuage.
LaqualitÉde la projection sera mesure par Inertie du nuage projet Taux= Inertie du nuage initial
3. Analyse en composantes principales (ACP) Il s’agit d’une analyse factorielle pour desvariables quantitatives. • Elle repose sur l’tude de lacorrÉlationentre les variables prises globalement. • Elle dfinit 2 ou 3 nouvelles variables (composantes) qui seront utilises pour reprsenter les donnes plus simplement.
Tableau des donnÈes Individu 1 2 3
Age 25 45 32
ReprÈsentation des donnÈes
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Revenu 1500 2231 1826
Enfants 0 3 2
Page 1
En gnral, on utilise des donnescentrÉes-rÉduites(standardi-ses) : • moyenne = 0 • cart-type = 1 L’inertie du nuage est alors gal aunombre de variablesp. L’ACP va dfinir de nouvelles variables (composantes) combinai-sons linaires des variables initiales :
C1=a1×Age+b1×Revenu+c1×En fants C2=a2×Age+b2×Revenu+c2×En fants C3∙ ∙= ∙
Les donnes seront alors reprsentes (projetes) À l’aide de ces composantes
ReprÈsentation des donnÈes projetÈes dans les composantes
Ètapes d’une ACP • Ètudes prliminairesunivariÉesetbivariÉes • Dtermination dunombre de composantesÀ retenir et calcul de laperte d’information • Dfinition des composantes et interprtation (analyse duale) • Analyse du nuage projet (analyse primale)
Exemple 1 Etude de 15 imprimantes jet d’encre suivant les critres suivants : • prix • coÛt impression (3000 pages) • Qualit d’impression • Vitesse d’impression N&B • Dure d’impression Couleur
Analyse univariÈe prÈliminaire
Analyse bivariÈe prÈliminaire
Nombre de composantes À retenir / Perte d’information
Perte d’information (2)
Analyse duale
Analyse primale
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Page 2
Analyse primale (2)
Exemple 2 Èude du nombre de licencis des rgions pour les sports suivants : • Football • Rugby • Ptanque • Tennis • Golf • (Basket) Nombre de licenciÉs en 2009 pour 10 000 habitants.
Analyse univariÈe prÈliminaire
Analyse bivariÈe prÈliminaire
Nombre de composantes À retenir / Perte d’information
Perte d’information (2)
Analyse duale
Analyse primale
Analyse primale (2)
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Page 3
Etude en 3 dimensions (avec Basket)
4. Analyse des correspondances (AFC) Il s’agit d’une analyse factorielle pourdeuxvariablesqualitatives, sous forme d’un tableau decontingence(tris croiss). • Elle repose sur l’tude de laliaison(Khi-deux) entre les deux variables. • LesmodalitÉsdes deux variables seront reprsentes dans un graphique À 2 ou 3 dimensions.
Tableau des donnÈes (contingence)
CAI AGE AGT
Limousin 1 11 3
France 2 3 7
Tableau des donnÈes « À plat »
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Mention CAI CAI CAI AGE AGE AGE AGT AGT AGT
Lieu Limousin France International Limousin France International Limousin France International
International 5 2 1
Effectif 1 2 5 11 3 2 3 7 1
Page 4
L’analyse des correspondances ralise deux analyses factorielles, une sur chacun des nuages :
• nuage desprofils-lignes: rpartition (%) des individus suivant les nde modalits de la 2 variable ; • nuage desprofils-colonnes: rpartition (%) des individus suivant re les modalits de la 1 variable.
Profils-lignes
CAI AGE AGT
Limousin 12.5 % 68.8 % 27.3 %
France 25.0 % 18.8 % 63.6 %
International 62.5 % 12.4 % 9.1 %
ReprÈsentation graphique des profils-lignes
ReprÈsentation graphique des profils-lignes
Profils-colonnes
CAI AGE AGT
Limousin 6.7 % 73.3 % 20.0 %
France 16.7 % 25.0 % 58.3 %
International 62.5 % 25.0 % 12.5 %
ReprÈsentation graphique des profils-colonnes
• L’inertie de chaque nuage est gale À l’Écart À l’indÉpendancedes deux variables : 2 X (fi jfi×fj) 2 '= fi×fj
• Les nuages sont projets dans l’espace À 2 ou 3 dimensions qui minimise la perte d’inertie. • L’origine des axes correspond auprofil moyen.
Ètapes d’une AFC • Lecture des tris croiss • Mesure de la liaison • Dtermination du nombre d’axes À retenir et calcul de la perte d’information • (Analyse des profils) • Analyse des nuages projets : proximits des modalits de chaque variable proximits des modalits entre les variables
Exemple 1 Enqute auprs des salaris d’une PME sur l’extension des horaires de travail
Statut: Ouvrier, Employ, Cadre, Intrimaire ; PrÉfÉrence: Matin, Midi-Deux, Soir, Samedi.
Tris croisÈs
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Page 5
Mesure du lien
Analyse des correspondances
Analyse des profils
ReprÈsentation graphique
Exemple 2 Rpartition des logements en Limousin Type: Occasionnel, Principal, Secondaire, Vacant ; DÉpartement: Corrze, Creuse, Haute-Vienne.
Tris croisÈs
Mesure du lien
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Page 6
Analyse des correspondances
Analyse des profils
ReprÈsentation graphique
5. Analyse des correspondances multiples (AFCM) Il s’agit d’une analyse factorielle, gnralisation de l’analyse des correspondances (simples). • Elle s’applique À un ensemble de variablesqualitativesmais aussi quantitatives discrÉditÉes. • Elle dcrit la liaison entre les (modalits des) variables.
• L’inertie du nuage ne mesure plus le lien :
Inertie=Nbre moyen de modalits–1
• L’interprtation est similaire À l’AFC, mais plus intuitive que ma-thmatique.
Pour obtenir les meilleurs rsultats, il est prfrable que : • les nombres de modalits des variables soient quivalents ; • les frquences marginales des modalits d’une variable soient du mme ordre de grandeur.
Exemple 1 Enqute de satisfaction auprs de la clientle de garage de rpara-tion automobile. Satisfaction: Satisfaction gnrale (oui ou non) RÉparation: Vhicule rpar (oui, non, nsp) Accueil: Qualit de l’accueil (1 À 5) Prix: Satisfaction Qualit-Prix (oui, non) FidÉlitÉ: Le client pense-t-il revenir ? (oui, non, nsp)
Tableau des donnÈes
Analyse des correspondances multiples
ReprÈsentation graphique
Profils
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Page 7
Discrimination
ReprÈsentation graphique
ReprÈsentation graphique (individus)
Exemple 2 Enqute auprs des salaris d’une PME sur l’extension des horaires de travail Sexe: Homme, Femme ; Age: 18-29, 30-39, 40-49,… Situation familiale: Seul, couple, seul avec enfants, couple avec enfants ; Statut: Ouvrier, Employ, Cadre, Intrimaire ; PrÉfÉrence: Matin, Midi-Deux, Soir, Samedi.
Tableau des donnÈes
Analyse des correspondances multiples
ReprÈsentation graphique
Profils
Discrimination
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Page 8
ReprÈsentation graphique
ReprÈsentation graphique (individus)
V. Jalby – M1 AES - Analyse des donnes – 2011-2012 – VII. Analyses statistiques multivaries descriptives
Page 9
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi