L analyse multivariée est-elle une méthode générale de recherche ? - article ; n°3 ; vol.12, pg 321-335
16 pages
Français

L'analyse multivariée est-elle une méthode générale de recherche ? - article ; n°3 ; vol.12, pg 321-335

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
16 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Histoire & Mesure - Année 1997 - Volume 12 - Numéro 3 - Pages 321-335
Is Multivariant Analysis a General Research Method? The methods of factorial analysis are usually considered to be generalizable and « objective ». The validity of that idea can be put to the following test. First, data are constructed whose structure is completely understood. Then, they are subject to several methods of factorial analysis to see if they retain that structure. Three types of data are thus treated, each having a negative result. The characteristics of an equilateral triangle do not reveal the Pythagorean theorem. A simple coding problem brings very different results depending on the method chosen. A table displaying interurban migration turns out to place the proximate cities at a distance. One might quite legitimately suggest, then, that the only way to choose a mode of analysis is to have complete undertanding of the data as a preliminary, which, of course, is exactly the goal of the analysis.
Les méthodes d’analyse factorielle ont souvent été présentées comme des outils généraux et « objectifs ». Pour vérifier cette assertion, on peut imaginer le test suivant : créer des données dont on connait ainsi parfaitement la structure, puis appliquer à ces données plusieurs méthodes d’analyse factorielle pour voir si elles retrouvent la structure. C’est ce qu’on a fait ici pour trois types de données qui ont toutes abouti à un résultat négatif. En entrant les caractéristiques des triangles rectangles, on ne retrouve pas le théorème de Pythagore, en entrant un problème simple de codage, on aboutit à des résultats très différents selon la méthode choisie, et en analysant un tableau de migrations interurbaines, on éloigne les villes les plus proches. En conclusion, seule une bonne connaissance de la structure des données peut déterminer un mode d’analyse dont le but est justement de découvrir ces structures.
15 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Informations

Publié par
Publié le 01 janvier 1997
Nombre de lectures 16
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

Hervé Le Bras
L'analyse multivariée est-elle une méthode générale de
recherche ?
In: Histoire & Mesure, 1997 volume 12 - n°3-4. pp. 321-335.
Abstract
Is Multivariant Analysis a General Research Method?
The methods of factorial analysis are usually considered to be generalizable and « objective ». The validity of that idea can be put
to the following test. First, data are constructed whose structure is completely understood. Then, they are subject to several
methods of factorial analysis to see if they retain that structure. Three types of data are thus treated, each having a negative
result. The characteristics of an equilateral triangle do not reveal the Pythagorean theorem. A simple coding problem brings very
different results depending on the method chosen. A table displaying interurban migration turns out to place the proximate cities
at a distance. One might quite legitimately suggest, then, that the only way to choose a mode of analysis is to have complete
undertanding of the data as a preliminary, which, of course, is exactly the goal of the analysis.
Résumé
Les méthodes d’analyse factorielle ont souvent été présentées comme des outils généraux et « objectifs ». Pour vérifier cette
assertion, on peut imaginer le test suivant : créer des données dont on connait ainsi parfaitement la structure, puis appliquer à
ces données plusieurs méthodes d’analyse factorielle pour voir si elles retrouvent la structure. C’est ce qu’on a fait ici pour trois
types de données qui ont toutes abouti à un résultat négatif. En entrant les caractéristiques des triangles rectangles, on ne
retrouve pas le théorème de Pythagore, en entrant un problème simple de codage, on aboutit à des résultats très différents selon
la méthode choisie, et en analysant un tableau de migrations interurbaines, on éloigne les villes les plus proches. En conclusion,
seule une bonne connaissance de la structure des données peut déterminer un mode d’analyse dont le but est justement de
découvrir ces structures.
Citer ce document / Cite this document :
Le Bras Hervé. L'analyse multivariée est-elle une méthode générale de recherche ?. In: Histoire & Mesure, 1997 volume 12 -
n°3-4. pp. 321-335.
doi : 10.3406/hism.1997.1550
http://www.persee.fr/web/revues/home/prescript/article/hism_0982-1783_1997_num_12_3_1550Histoire & Mesure, 1997, XII-3/4, 321-336
Hervé Le Bras*
L'analyse multivariée est-elle
une méthode générale de recherche ?
Résumé : Les méthodes d'analyse factorielle ont souvent été présentées comme des outils
généraux et « objectifs ». Pour vérifier cette assertion, on peut imaginer le test suivant : créer
des données dont on connaît ainsi parfaitement la structure, puis appliquer à ces données
plusieurs méthodes d'analyse factorielle pour voir si elles retrouvent la structure. C'est ce
qu'on a fait ici pour trois types de données qui ont toutes abouti à un résultat négatif. En
entrant les caractéristiques des triangles rectangles, on ne retrouve pas le théorème de
Pythagore, en entrant un problème simple de codage, on aboutit à des résultats très différents
selon la méthode choisie, et en analysant un tableau de migrations interurbaines, on éloigne les
villes les plus proches. En conclusion, seule une bonne connaissance de la structure des
données peut déterminer un mode d'analyse dont le but est justement de découvrir ces
structures.
Abstract: Is Multivariant Analysis a General Research Method? The methods of factorial
analysis are usually considered to be generalizable and « objective ». The validity of that idea
can be put to the following test. First, data are constructed whose structure is completely
understood. Then, they are subject to several methods of factorial analysis to see if they retain
that structure. Three types of data are thus treated, each having a negative result. The
characteristics of an equilateral triangle do not reveal the Pythagorean theorem. A simple
coding problem brings very different results depending on the method chosen. A table
displaying interurban migration turns out to place the proximate cities at a distance. One might
quite legitimately suggest, then, that the only way to choose a mode of analysis is to have
complete undertanding of the data as a preliminary, which, of course, is exactly the goal of the
analysis.
* Laboratoire de Démographie Historique, EHESS/CNRS, 54 boulevard Raspail,
75006 - Paris.
321 Histoire & Mesure, 1997, XII-3/4
Dans le courant des années 70, l'analyse des correspondances
était très en vogue. Elle était recommandée par son promoteur
J.-P. Benzécri, comme une méthode « universelle et objective »
capable d'analyser n'importe quel tableau de contingence, c'est-à-
dire n'importe quel classement d'éléments selon les catégories de
deux critères. On disait aussi qu'elle découvrait la structure d'un
tableau du %, indiquant par là que son matériau relevait de ce test
statistique. Une partie de la sociologie française a été durablement
impressionnée par cette technique qu'elle emploie encore.
Sur quoi repose cependant le principe de l'analyse des corre
spondances et de l'analyse en composantes principales qui opère selon
un principe voisin ? Sur une simplification des espaces euclidiens 1 à
n dimensions en sous-espaces de plus faible dimension, dit-on
d'habitude. Ceci décrit le procédé, non la rationalité. Pourquoi un
angle de vue particulier d'une représentation euclidienne particulière
dévoilerait-il la structure ? Et peut-on faire apparaître une structure
sans en avoir eu une première intuition ? La tradition factorielle
repose sur deux postulats : l'existence d'une structure dans les
données indépendamment de l'observateur, et même indépendam
ment de la collecte, et, en second lieu, la possibilité de lire la structure
avec un outil universel indépendant lui aussi, de la structure. C'est
d'ailleurs ces deux postulats qui justifiaient, pour J.-P. Benzécri, les
qualificatifs d'universel et d'objectif. Nous ne discuterons pas ici de
1. On a pris l'habitude de désigner par plan factoriel un plan constitué par deux axes
principaux. Le premier axe principal est la combinaison linéaire des lignes (ou des
colonnes) du tableau initial de données dont la variation est maximale (en normant les
coefficients de la combinaison linéaire). Le second axe a la même définition pour les
résidus du premier axe, et ainsi de suite. Selon les transformations effectuées sur les
données (standardisation ou double centrage par exemple), et selon la manière dont la
variation est calculée, on trouve différentes formes d'analyse : en composantes princi
pales brutes ou normées, en interaction, et des correspondances. Une autre manière de
présenter les choses consiste à imaginer les problèmes dans des espaces euclidiens à n
dimensions où les lignes du tableau des données représentent les axes et les colonnes des
points, et vice-versa. Alors le premier plan factoriel ou principal est celui pour lequel la
somme des carrés des distances des points est la plus faible. On dit qu'il passe « le mieux
possible » à travers le nuage des points. L'intérêt de présenter ces méthodes dans le cadre
de la géométrie euclidienne à n dimensions est manifeste avec les composantes
principales car les moyennes sont des centres de gravité, les variances des inerties, et les
corrélations des cosinus. Une présentation astucieuse de l'analyse des correspondances
utilise l'idée de barycentre, ou plus exactement d'alpha-barycentre. Supposons que
chaque ligne du tableau des données soit représentée par une coordonnée U sur un axe
et colonne par une coordonnée V, alors, en réduisant toutes les valeurs d'une ligne
sur les différentes colonnes à des probabilités par division de leur somme, on peut
chercher une valeur a telle que chaque ligne soit au barycentre des coordonnées des
colonnes multiplié par a et chaque colonne au barycentre des coordonnées des lignes
multiplié par ce même a. La solution est le premier axe de l'analyse des correspondances.
322 Hervé Le Bras
manière théorique le bien-fondé d'une telle position car cela nous
entraînerait sur le terrain philosophique très général de la critique du
dualisme et de l'idéalisme. Nous allons seulement prendre au mot la
revendication d'universalité et d'objectivité en soumettant des objets

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents