Correspondance entre l

Correspondance entre l'analyse binaire classique et l'analyse de Benzécri - article ; n°1 ; vol.77, pg 149-160

-

Documents
13 pages
Lire
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

L'année psychologique - Année 1977 - Volume 77 - Numéro 1 - Pages 149-160
Summary
Gorrespondence between classical two-mode analysis and Benzecri's analysis
Classical two-mode analysis of a table of data is based on quadratic distance; Benzecri's analysis of a table of frequencies is based on the Benzecri distance, also called χ² distance. It is shown that a Benzecri analysis can be associated to any classical analysis of data which are defined on an interval scale, so that the representation space of Benzecri's analysis is a central projection of the representation space of classical analysis.
Benzecri's method plays for the classical method a role similar to Thurstonc's method of extended vectors for factor analysis. An illustration is given.
Résumé
Correspondance entre l'analyse binaire classique et l'analyse de Benzécri
L'analyse binaire classique d'un tableau de valeurs utilise la distance quadratique ; l'analyse de Benzécri d'un tableau d'effectifs utilise la distance de Benzécri, dite aussi distance de χ². On montre qu'à toute analyse classique de valeurs définies sur une échelle d'intervalles on peut associer une analyse de Benzécri et réciproquement, de sorte que l'espace de représentation de l'analyse de Benzécri soit une projection centrale de l'espace de représentation de l'analyse classique. Ainsi la méthode de Benzécri joue pour la méthode classique un rôle semblable à la méthode des vecteurs étendus de Thurstone pour l'analyse factorielle. Une illustration est donnée.
12 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Sujets

Informations

Publié par
Ajouté le 01 janvier 1977
Nombre de lectures 22
Langue Français
Signaler un abus

J.-M. Faverge
Correspondance entre l'analyse binaire classique et l'analyse de
Benzécri
In: L'année psychologique. 1977 vol. 77, n°1. pp. 149-160.
Abstract
Summary
Gorrespondence between classical two-mode analysis and Benzecri's analysis
Classical two-mode analysis of a table of data is based on quadratic distance; Benzecri's analysis of a table of frequencies is
based on the Benzecri distance, also called χ² distance. It is shown that a Benzecri analysis can be associated to any classical
analysis of data which are defined on an interval scale, so that the representation space of Benzecri's analysis is a central
projection of the representation space of classical analysis.
Benzecri's method plays for the classical method a role similar to Thurstonc's method of extended vectors for factor analysis. An
illustration is given.
Résumé
Correspondance entre l'analyse binaire classique et l'analyse de Benzécri
L'analyse binaire classique d'un tableau de valeurs utilise la distance quadratique ; l'analyse de Benzécri d'un tableau d'effectifs
utilise la distance de Benzécri, dite aussi distance de χ². On montre qu'à toute analyse classique de valeurs définies sur une
échelle d'intervalles on peut associer une analyse de Benzécri et réciproquement, de sorte que l'espace de représentation de
l'analyse de Benzécri soit une projection centrale de l'espace de représentation de l'analyse classique. Ainsi la méthode de
Benzécri joue pour la méthode classique un rôle semblable à la méthode des vecteurs étendus de Thurstone pour l'analyse
factorielle. Une illustration est donnée.
Citer ce document / Cite this document :
Faverge J.-M. Correspondance entre l'analyse binaire classique et l'analyse de Benzécri. In: L'année psychologique. 1977 vol.
77, n°1. pp. 149-160.
doi : 10.3406/psy.1977.28185
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1977_num_77_1_28185Année psychol.
1977, 77, 149-160
NOTE
CORRESPONDANCE
ENTRE L'ANALYSE BINAIRE CLASSIQUE
ET DE BENZÉCRI
par J.-M. Faverge
Faculté des Sciences psychologiques et pédagogiques1
Université Libre de Bruxelles
SUMMARY
Correspondence between classical two-mode analysis
and Benzécri's analysis
Classical two-mode analysis of a table of data is based on quadratic
distance; BenzècrVs of a of frequencies is based on the
Benzécri distance, also called x2 distance. It is shown that a Benzécri
analysis can be associated to any classical analysis of data which are
defined on an interval scale, so that the representation space of 's is a central projection of the of classical
analysis.
BenzècrVs method plays for the classical method a role similar to
Thurstonc's of extended vectors for factor analysis. An illustration
is given.
Etant donné un tableau de correspondance d'éléments z^ entre
lignes i et colonnes /, on développe des méthodes permettant de repré
senter ces lignes et colonnes par des points images Mj et Nj dans le
1. 44, avenue Jeanne, B 1050 Bruxelles. 150 NOTE
même espace de façon que les distances d^, entre deux images lignes
(ou images colonnes) soient données par
ou
où Zi est le total de la ligne i, zj le total de la colonne /', z le total de tous
les éléments du tableau (Faverge, 1975). Dans le premier cas, nous avons
appelé la méthode « Analyse binaire classique » en raison du fait qu'elle
introduit la distance quadratique qui est à la base de toute la statistique
classique à commencer par la notion de variance.
Dans le deuxième cas, il s'agit de la méthode appelée par Benzécri
« Analyse factorielle des correspondances » partant d'une distance qui
s'impose logiquement lorsque le tableau est un tableau d'effectifs
(Benzécri, 1973).
En général, dans la pratique, on ne reproduit qu'approximativement
les distances en réduisant le nombre de dimensions de l'espace de
représentation.
A priori, on ne devrait utiliser la méthode de Benzécri que lorsque
le tableau de correspondance est un tableau d'effectifs ; dans le cas où
le est un tableau de valeurs d'une variable, il faudrait choisir
la méthode binaire classique, d'autant plus intéressante qu'elle autorise
un groupement préalable des lignes (ou colonnes) par les méthodes
typologiques classiques (supposant prise la distance quadratique) et
qu'elle s'applique au tableau des images des colonnes (au sens de
Guttman, obtenues par la technique des moindres carrés), tableau dont
l'analyse est plus économique en terme de la dimension de l'approximat
ion retenue parce que la soustraction de l'anti-image a un résultat
semblable à la soustraction de la partie spécifique dans le cas de l'analyse
factorielle (Faverge, 1975 b).
Cependant, en pratique, on constate que les deux méthodes donnent
souvent des résultats voisins ; ils sont même identiques lorsque le tableau
a ses totaux de lignes et colonnes égalisés, car alors les z$ étant égaux
ainsi que les z'j, la distance de Benzécri est la distance quadratique (à
un facteur constant près). Comme il y a des raisons d'égaliser les totaux
par addition d'une ligne et d'une colonne que j'ai appelés Terre dans
mon livre (Faverge, 1975, a), on se trouve souvent dans le cas où les
deux méthodes sont équivalentes.
Je me propose, dans les lignes qui suivent, d'examiner la correspon
dance existant entre analyse classique et analyse de Benzécri et d'en
déduire une procédure unique d'analyse. J.-M. FAVERGE 151
PASSAGE D'UNE ANALYSE DE BENZÉCRI
A UNE ANALYSE CLASSIQUE ET RÉCIPROQUE
Soit ny- un élément d'un tableau de correspondance à l'intersection
de la ligne i et de la colonne /, soit n^ le total des éléments de la ligne i
et n'j le total des éléments de la colonne /. On sait que la méthode de
Benzécri consiste essentiellement à résoudre le système
où X et Y sont des vecteurs et p un nombre non négatif. Ce système
s'écrit :
J~ P \
= S/i^. où n = Hn'j
Sous cette forme, on voit que cette résolution est celle du système
fondamental d'une analyse classique appliquée au tableau d'élément
général
_ nij
zij / 7 (1)
V
Cette , analyse aura pour vecteurs correspondants les /y /— n X et
— Y et mêmes nombres p (mêmes racines latentes p2) ; pour être
n
précisés ces vecteurs (dits latents) sont supposés normes.
Ainsi une analyse de Benzécri est une analyse classique appliquée
au tableau correspondant Zy.
Puisque les racines latentes sont les mêmes, l'obtention des points
images à partir des vecteurs latents relève de la même transformation
dans les deux analyses, de sorte que
»- lit,* r .
OMf = V /— n OM? 152 NOTE
où M*, N^ sont les points images dans l'analyse de Benzécri et Mf, NJ
les points images correspondants classique.
Les espaces de représentation ont même dimension r ; cepen
dant, on sait que dans l'analyse de Benzécri, il y a toujours une solu
tion X$ = cte, Yy = cte, p = 1 ; ainsi les points M$ et N* sont dans un
hyperplan de dimension r — 1 et l'on peut dire qu'ils sont projections
centrales (de centre 0) des points Mf et Nj ; dans la figure 1, on a sup
posé r = 3.
Réciproque :
a) Le passage explicite des z^ aux n^ demande la résolution des le
équations (1) aux inconnues n^ (l nombre de lignes, c nombre de
colonnes).
On écrit :
et en sommant
En divisant par ^, on a : J.-M. FAVERGE 153
et de même :
V /- n = ^ y V h n
Ces équations expriment que l'analyse classique de zy- doit avoir la
racine latente 1 et que les vecteurs latents associés sont
Ainsi, pour que les équations (1) soient résolubles en ny il est néces
saire que l 'analyse classique du tableau donné des zy- ait la racine latente 1
et que les vecteurs latents associés aient des coordonnées toutes positives
ou nulles.
S'il en est ainsi, cette analyse donne :
ni n,n* _ n ni:
-1 = X?, - = Yj et -5 = a« Xf Y,. n n 3 n ' 3
Ainsi, la condition précédente est aussi suffisante.
b) Cependant, une condition supplémentaire sur le tableau des z^
doit être introduite pour que le tableau des solutions n^ soit traitable
par la méthode de Benzécri. Les n^ doivent être positifs ou nuls, donc
aussi les z^.
Retenons maintenant uniquement cette condition Zy- ^ 0.
Faisons déjà appel au théorème de Perron-Fröbenius (voir par exemple
Gantmacher, 1965).
Si les Zy- sont positifs, il existe une racine latente simple supérieure à
toutes les autres ; les vecteurs latents correspondants ont leurs coordonnées
positives.
En réalité, le théorème de Perron-Fröbenius s'applique à la
matrice Z' Z (ou ZZ'), mais si Z a tous ses éléments positifs, Z'Z et ZZ'
les ont aussi (Z matrices d'éléments zy).
En ajoutant un même nombre convenable à tous les zy- quels qu'ils
soient, on peut les rendre tous strictement positifs. Le théorème de
Perron-Fröbenius s'applique alors. En multipliant tous les zy- obtenus
par un même nombre positif (changement d'unité), on peut rendre la
plus grande racine latente égale à un.
Ainsi :
Etant donné un tableau de valeurs, on peut par substitution linéaire
le transformer en un de nombres zv- : 154 NOTE
tels que les images M% et Nj des lignes et colonnes de z^ dans l'analyse
classique et les images M* et N* des lignes et colonnes de n^ dans
l'analyse de Benzécri soient liées par les relations :
ÖM? = /-ÖM?
ÖNS 3 = V /-ON?. n }
Remarque. — Le théorème de Perron-Fröbenius s'étend au cas où
certains z$ seraient nuls en remplaçant pour les vecteurs latents associés
à la racine maximale les mots « coordonnées positives » par les mots
« coordonnées non négatives ». Cependant, dans son utilisation présente
le cas doit être écarté où une coordonnée est nulle ; si, par exemple,
= 0 alors ni = 0 et tous les n^ de la ligne i seraient /V Iff
nuls.
On voit donc que des valeurs nulles pour les z# ne sont acceptables
que si les vecteurs latents associés à la racine maximale à coordon
nées strictement positives.
MÉTHODE D'ANALYSE d'un TABLEAU DE VALEURS
UTILISANT LA CORRESPONDANCE ENTRE LA MÉTHODE CLASSIQUE
ET LA MÉTHODE DE BENZÉCRI
La méthode de Benzécri qui s'applique à un tableau d'effectifs a sur
la méthode classique qui s'applique à un tableau de valeurs l'avantage
de réduire d'une unité la dimension de l'espace de représentation puisque
les points M* et N^ sont dans un hyperplan de dimension r — 1 où r est
le rang du tableau.
Si l'on désire que les points Mf soient de même dans un hyperplan
orthogonal à l'axe correspondant à la racine maximale, on doit supposer
que /— = cte, c'est-à-dire que les totaux des lignes du tableau des ra
ssoient constants.
Si on veut aussi que les points N£ aient cette propriété, les n'j seront
aussi Dans ce cas z^ sera proportionnel à n^ et le tableau
des Zij sera à totaux des lignes et des colonnes égalisées. Pour cette
raison nous avons proposé d'appliquer la méthode classique après avoir
égalisé les totaux du tableau des Zy- par adjonction d'une ligne et d'une
colonne Terre ; par convention nous nommerons dans la suite cette
procédure méthode Terre. J.-M. FA.VERGE 155
Mais on peut atteindre le même objectif de représentation dans un
espace de rang r — 1 par projection centrale des points Mf et N^. Nous
nommerons cette nouvelle procédure méthode de projection centrale. En
voici les étapes.
Méthode de projection centrale
Etant donné un tableau de valeurs :
1) Ajouter à ces valeurs un nombre convenable les rendant toutes
positives ou nulles (compte tenu de la remarque faite plus haut concer
nant les valeurs nulles). On pourra par exemple rendre nulle la plus
petite valeur (négative) du tableau initial. Cette opération est en général
admissible car la variable constitue presque toujours une échelle d'inter
valles (origine arbitraire).
2) Effectuer l'analyse classique du tableau zt?- ainsi obtenu. Il est
inutile de ramener la racine maximale à la valeur unité par multipli
cation convenable des z^, cette multiplication réalisant une homothétie
de centre O sur les images sans importance dans la projection centrale.
3) Projeter centralement (le centre étant l'origine des axes) les
images des lignes et colonnes sur un hyperplan orthogonal à l'axe
correspondant à la racine latente maximale. Il n'est pas nécessaire ici
encore de choisir un hyperplan plutôt qu'un autre pour raison
d'homothétie.
On obtient ainsi à une homothétie près les images de l'analyse de
Benzécri associée.
On remarquera la similitude de la méthode de projection centrale
et de la méthode des vecteurs étendus de Thurstone en analyse
factorielle.
Les transformations préalables des valeurs du tableau
Avant d'être traité le tableau de correspondance subit en général
un certain nombre de transformations :
1) Souvent on effectue des substitutions linéaires sur les colonnes,
par exemple on les amène à avoir la même moyenne (qui peut être 0)
et la même variance (qui peut être 1).
2) Dans le premier temps de la méthode, a-t-on vu, on ajoute une
constante aux valeurs du tableau pour les rendre positives. Cette cons
tante est arbitraire pourvu cependant qu'elle joue son rôle.
Changer de constante revient à changer l'origine des axes, la confi
guration rigide des points Mf ne change pas puisque les distances entre
lignes ne changent pas ; il en est de même de la configuration des N$.
On change donc de centre de projection (et aussi de plan de project
ion), ainsi changent les configurations rigides des M$ et N$ qui devien- 156 NOTE
nent une autre projection centrale des mêmes nuages (dont la disposition
relative change aussi).
3) On remplace certaines fois le tableau par le tableau des images
des colonnes au sens de Guttman (Faverge, 1975 b). Les configurations
de pointes Mf et N^ changent, donc aussi celles des points M* et N$.
4) On effectue souvent un groupement des lignes par emploi d'une
méthode typologique (on forme des groupes aussi bien séparés que
possible et dont les points sont aussi proches les uns des autres que au sens des distances quadratiques). On a :
1 / «m n;, ; \2
i — Yt? -. -ï2 — y — i — — i
On remarquera que cette dernière expression n'est pas une distance
de Benzécri. Par contre, on a :
— - — -2, n In;: ni, As 2
M? M,*, =2- (— — — I
nj\ni ni' J
Dans le premier cas, la distance est une distance quadratique sur la
variable
Dans le deuxième cas, la distance est une distance quadratique sur
la variable
Hi — «,• a/ / rij / — "%i J I aJ nf
La méthode typologique classique peut alors être appliquée soit
aux Zij (à l'espace des Mt?), soit aux ^ (à l'espace des M*).
En général, lorsque le tableau de départ est celui des z^-, c'est-à-dire
d'une analyse classique et où la projection centrale n'est utilisée qu'aux
fins d'interprétation, on fera simplement la typologie sur les z^. On
imagine cependant la possibilité d'étendre la technique de groupement
de lignes au cas d'un tableau n^ de Benzécri, par typologie ordinaire
sur les — — — ou sur les — nij /— ln .
ni V "j
EXEMPLE
Traitons par cette méthode des données relatives à un questionnaire
de style ouvrier, que nous avons analysées ailleurs (Faverge, 1975 b),
par la méthode Terre.
Il comprenait 10 questions bipolaires où le questionné répondait J.-M. FAVERGE 157
par interpolation entre les pôles, les réponses étant ensuite notées de 1 à 5.
On substituait au tableau de données brutes obtenues le tableau
des images, on opérait sur ce tableau un groupement des lignes en
10 groupes et on ajoutait les 10 colonnes réciproques. Nous ne repro
duirons pas ici le questionnaire, mais donnerons plus loin les libellés
des 8 questions qui caractérisent les deux facteurs retenus.
On a donc un tableau de valeurs de 10 lignes (les groupes) et
20 colonnes (les questions). Ce tableau est soumis à l'analyse binaire
classique.
Les racines latentes ordonnées en valeurs décroissantes sont :
M A B
13262 139 111 65 28 7 0...
Gardons les trois premières M, A, B, désignons les axes correspon
dants par les mêmes lettres. On obtient pour coordonnées des images
des questions les nombres suivants (les nombres surlignés désignent les
réciproques). Quest
Axes
ions M A B AIM x 100 BjMxlOO
— 4,96 — 21 1 23,47 1,16 5
— 3,80 — 18 2 20,85 3,19 15
1,88 2,25 10 12 3 18,76
— 1,46 — 6 4 25,16 3,96 16
— 0,02 5 30,30 1,57 0 5
4 9 6 32,91 1,31 2,84
32,79 2,22 3,07 7 9 7
— 1,79 — 1,81 — 8 — 8 23,83 8
9 31,95 1,87 0,74 6 2
10 25,30 0,52 2,05 2 8
— 1,66 — 6 4,76 18 1 27,08
— 11 — 3,39 2 29,71 3,30 11
— 2,08 — 2,75 — 7 — 9 3 31,79
— 4,16 — 16 4 0,96 4 25,39
— 0,18 — 2,08 — 1 — 10 5 20,26
— 9 — 19 — 1,50 — 3,35 6 17,64
— 20 — 2,42 — 3,57 — 14 7 17,77
loo 26,73 1,59 1,31 6 5
— 2,07 — 1,25 — 11 7 18,61 9
— 2,56 — 3 — 10 — 0,72 10 25,25
On a ajouté deux colonnes A/M x 100 etB/M x 100 obtenues par divi
sion des termes des précédentes et donnant les coordonnées des projections
centrales N* des points N^ sur un plan perpendiculaire à l'axe M.
(Les valeurs obtenues ont été arrondies à leurs parties entières.)
La figure 2 représente les points N$- dans ce plan.