Données géographiques

-

Livres
211 pages
Lire un extrait
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Cet ouvrage facilite la compréhension et l'usage des principales méthodes d'analyse statistique multivariée dans le cadre de l'information spatialisée. L'approche spatiale étant par essence combinatoire, donc complexe, elle nécessite des outils dédiés à l'analyse multidimensionnelle et à la représentation synthétique de ses résultats. Parmi toutes les techniques possibles d'analyse multidimensionnelle, le choix a été fait de présenter les méthodes purement statistiques et celles dont les résultats sont suffisamment stables et bien maîtrisés. À l'aide d'exemples et d'exercices corrigés Données géographiques introduit les notions mises en œuvre par l'intermédiaire des logiciels courants. Il expose les différentes analyses factorielles et les méthodes de classification et de régression multiple.
Introduction. Chapitre 1. Analyses factorielles : généralités. Chapitre 2. L'analyse en composantes principales (ACP). Chapitre 3. L'analyse des correspondances (AFC). Chapitre 4. Analyse des correspondances multiples. Chapitre 5. Méthodes de classification. Chapitre 6. Régression multiple. Chapitre 7. Méthodes explicatives : compléments. Bibliographie. Annexe 1 : Logiciels utilisés. Annexe 2 : Exemples et exercices traités.

Sujets

Informations

Publié par
Date de parution 24 février 2011
Nombre de visites sur la page 3
EAN13 9782746241466
Langue Français

Informations légales : prix de location à la page 0,0292 €. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Signaler un problème
Données géographiques
© LAVOISIER, Paris, 2011 LAVOISIER 11, rue Lavoisier 75008 Paris www.hermes-science.com www.lavoisier.fr ISBN 978-2-7462-3116-0 Le Code de la propriété intellectuelle n’autorisant, aux termes de l’article L. 122-5, d’une part, que les "copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective" et, d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, "toute représentation ou reproduction intégrale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause, est illicite" (article L. 122-4). Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles L. 335-2 et suivants du Code de la propriété intellectuelle. Tous les noms de sociétés ou de produits cités dans cet ouvrage sont utilisés à des fins d’identification et sont des marques de leurs détenteurs respectifs. Printed and bound in England by Antony Rowe Ltd, Chippenham, January 2011.
Données géographiquesanalyse statistique multivariée
Pierre Dumolard
TABLE DES MATIÈRES
Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Chapitre 1. Analyses factorielles : généralités. . . . . . . . . . . . . . . . . . . 13
1.1. Historique des analyses factorielles. . . . . . . . . . . . . . . . . . . . . . 14 1.2. Traits communs aux analyses factorielles . . . . . . . . . . . . . . . . . . 14 1.2.1. Un tableau numérique peut se représenter par un nuage de points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.2.2. Résumer ce nuage de points consiste à le projeter sur un sous espace de dimension inférieure (idéalement de dimension 2 de façon à pouvoir le graphiquer) . . . . . . . . . . . . . . . . . . . . . . . 15 1.3. Procédure algébrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.4. Informatiquement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.5. En résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.5.1. En termes géométriques . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.5.2. En termes algébriques . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.5.3. En termes informatiques . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.5.4. En termes d’information . . . . . . . . . . . . . . . . . . . . . . . . . 22
Chapitre 2. L’analyse en composantes principales (ACP). . . . . . . . . . . 23
2.1. Connaissances de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1.1. Types de tableaux pour l’ACP . . . . . . . . . . . . . . . . . . . . . 23
6 Données géographiques
2.1.1.1.Matrice d’information non spatiale . . . . . . . . . . . . . . . 24 2.1.1.2.Matrice d’information spatiale . 25. . . . . . . . . . . . . . . . . 2.1.1.3.. . . . . . . . . 25Matrice d’information spatio-chronologique 2.1.1.4.. . . . . 28Matrice d’information chronologique multivariée . 2.1.2. La création d’un tableau de données pour l’ACP . . . . . . . . . . 29 2.1.3. Les 3 phases d’une ACP sur ces types de tableaux . . . . . . . . . 30 2.1.3.1. Transformation du tableau de données et calcul des covariances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.1.3.2. Calcul des axes factoriels et de leur % de variance . . . . . . 35 2.1.3.3. Aides à l’interprétation des résultats . . . . . . . . . . . . . . 35 2.1.4. Quelques conseils de bon usage . . . . . . . . . . . . . . . . . . . . 44 2.2. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.2.1. Exercice 1 : démographie des pays d’Afrique occidentale . . . . . 46 2.2.1.1. Aides à l’interprétation de l’ACP . . . . . . . . . . . . . . . . 47 2.2.2. Exercice 2 : croîts naturels et migratoires des départements du S.E. de la France . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Chapitre 3. L’analyse des correspondances (AFC) . . . . . . . . . . . . . . . 67
3.1. Connaissances de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3.1.1. Types de tableaux pour l’AFC . . . . . . . . . . . . . . . . . . . . . 67 3.1.1.1. Tableau de contingence . . . . . . . . . . . . . . . . . . . . . . 67 3.1.1.2. Extension de la notion de tableau de contingence. . . . . . . 68 3.1.1.3. Notations de base . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.1.2. Différences de l’AFC par rapport à l’ACP . . . . . . . . . . . . . . 70 3.1.2.1. Transformation des données et calcul des covariances . . . . 70 3.1.2.2. Calcul des Vecteurs Propres et valeurs propres de C . . . . . 75 3.1.2.3. Aides à l’interprétation d’une AFC . . . . . . . . . . . . . . . 75 3.1.3. AFC sur tableaux de contingence à plus de 2 caractères . . . . . . 82 3.1.3.1. Altitude, pente, utilisation du sol du département de la Savoie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 3.1.3.2. Interprétation de l’axe 1 (75 % de variance) . . . . . . . . . . 84 3.1.3.3. Interprétation de l’axe 2 (25 % de variance) . . . . . . . . . . 85 3.1.3.4. Plan des axes 1 et 2 (100 % de variance) . . . . . . . . . . . . 85 3.2. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 3.2.1. Exercice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 3.2.2. Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Table des matières 7 Chapitre 4. Analyse des correspondances multiples. . . . . . . . . . . . . . . 99
4.1. Connaissances de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.1.1. Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.1.1.1. Transformation du fichier en tableau de Burt . . . . . . . . . 99 4.1.1.2. Tableau disjonctif complet . . . . . . . . . . . . . . . . . . . . 102 4.1.1.3. Equivalence des AFC sur tableau disjonctif complet et tableau de Burt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.1.2. Résultats de l’AFCM du tableau binaire 4.3 . . . . . . . . . . . . . 104 4.2. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4.2.1. Exercice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4.2.2. Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
Chapitre 5. Méthodes de classification127. . . . . . . . . . . . . . . . . . . . . . .
5.1. Connaissances de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 5.1.1. Utilité en géographie . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 5.1.2. Méthodes graphiques de classification . . . . . . . . . . . . . . . . 128 5.1.2.1. Graphique cartésien . . . . . . . . . . . . . . . . . . . . . . . . 128 5.1.2.2. Classification par arborescence « raisonnée » . . . . . . . . . 128 5.1.2.3. Diagramme triangulaire . . . . . . . . . . . . . . . . . . . . . . 130 5.1.2.4. Matrice ordonnable de J. Bertin . . . . . . . . . . . . . . . . . 130 5.1.3. Méthodes numériques de classification . . . . . . . . . . . . . . . . 131 5.1.3.1. Algorithmes de convergence . . . . . . . . . . . . . . . . . . . 133 5.1.3.2. Algorithmes des nuées dynamiques . . . . . . . . . . . . . . . 136 5.1.4. Classification Arborescente Hiérarchique (CAH) . . . . . . . . . . 137 5.1.4.1. Choix d’une distance entre individus statistiques . . . . . . . 137 5.1.4.2. Choix d’un critère d’agrégation . . . . . . . . . . . . . . . . . 138 5.2. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 5.2.1. Exercice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 5.2.2. Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 5.3. Référence citée dans ce chapitre . . . . . . . . . . . . . . . . . . . . . . . 157
Chapitre 6. Régression multiple. . . . . . . . . . . . . . . . . . . . . . . . . . 159 .
6.1. Connaissances de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 6.1.1. Le modèle de la régression multiple . . . . . . . . . . . . . . . . . . 159
8 Données géographiques
6.1.1.1. Extension du modèle de régression simple à plusieurs variables explicatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 6.1.1.2. Exemple élémentaire. . . . . . . . . . . . . . . . . . . . . . . . 162 6.1.1.3. En résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 6.1.1.4. Tests sur données d’échantillon . . . . . . . . . . . . . . . . . 165 6.1.2. Corrélations multiples et partielles . . . . . . . . . . . . . . . . . . . 167 6.1.2.1. Coefficient de corrélation multiple . . . . . . . . . . . . . . . 167 6.1.2.2. Tests sur R et R² . . . . . . . . . . . . . . . . . . . . . . . . . . 168 6.1.2.3. Coefficients de corrélation partielle . . . . . . . . . . . . . . . 168 6.1.3. Régression multiple pas à pas . . . . . . . . . . . . . . . . . . . . . . 169 6.1.4. Ajout d’une variable catégorielle à une régression multiple . . . . 170 6.1.4.1. Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 6.1.4.2. Conditions de validité de 1’ANCOVA . . . . . . . . . . . . . 172 6.2. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 6.2.1. Exercice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 6.2.2. Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
Chapitre 7. Méthodes explicatives : compléments. . . . . . . . . . . . . . . . 187
7.1. L’analyse discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 7.1.1. Modèle général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 7.1.2. Deux usages de l’analyse discriminante . . . . . . . . . . . . . . . . 189 7.1.2.1. Analyse des fonctions discriminantes . . . . . . . . . . . . . . 189 7.1.2.2. Construction d’une classification explicative / prédictive . . 190 7.1.2.3. Conditions de validité du modèle . . . . . . . . . . . . . . . . 191 7.1.3. Exemple d’analyse discriminante . . . . . . . . . . . . . . . . . . . 191 7.2. La segmentation (ou arbre de classification) . . . . . . . . . . . . . . . . 193 7.2.1. L’algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 7.2.1.1. Critère de choix d’une variable explicative . . . . . . . . . . 194 7.2.1.2. Conditions d’arrêt de la construction de l’arbre . . . . . . . . 194 7.2.2. Aides à l’interprétation . . . . . . . . . . . . . . . . . . . . . . . . . . 194 7.2.3. Usages, avantages et limites de la segmentation . . . . . . . . . . . 196 7.2.3.1. Deux types d’usage . . . . . . . . . . . . . . . . . . . . . . . . 196 7.2.3.2. Principales utilisations actuelles . . . . . . . . . . . . . . . . . 196 7.2.3.3. Avantages et limites de la méthode . . . . . . . . . . . . . . . 197