Une méthode de comparaisons par blocs et par paires - article ; n°2 ; vol.59, pg 395-406

De
Publié par

L'année psychologique - Année 1959 - Volume 59 - Numéro 2 - Pages 395-406
Résumé
Pouf alléger le travail expérimental normalement requis par la méthode dès comparaisons par paires, on propose une méthode de comparaisons par blocs et par paires : l'ensemble des objets est divisé en deux blocs, dans chacun desquels le sujet fait un choix, puis les deux objets ainsi désignés sont comparés entre eux (paire). Pour analyser les résultats d'un tel processus de choix, on utilise un modèle développe par ailleurs et l'on étudie le problème des erreurs ; deux méthodes correctives, itérative et logarithmique, sont proposées. L'application à des résultats expérimentaux est assez satisfaisante.
Summary
In order to lighten the exrperirnental work normally required by the paired comparison method, a method of comparison by blocks and pairs is suggested. The objects dre divided into two blocks, from each which the subject makes a choice, and then the two objects thus picked out are compared with each other (pair). To analyse the results of such a choosing procedure, a model developed elsewhere is used and the error problem is studied : two corrective methods are proposed, iterative and logarithmic. The application to experimental results proves quite satisfactory.
12 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : jeudi 1 janvier 1959
Lecture(s) : 10
Nombre de pages : 13
Voir plus Voir moins

Claude Flament
Une méthode de comparaisons par blocs et par paires
In: L'année psychologique. 1959 vol. 59, n°2. pp. 395-406.
Résumé
Pouf alléger le travail expérimental normalement requis par la méthode dès comparaisons par paires, on propose une méthode
de comparaisons par blocs et par paires : l'ensemble des objets est divisé en deux blocs, dans chacun desquels le sujet fait un
choix, puis les deux objets ainsi désignés sont comparés entre eux (paire). Pour analyser les résultats d'un tel processus de
choix, on utilise un modèle développe par ailleurs et l'on étudie le problème des erreurs ; deux méthodes correctives, itérative et
logarithmique, sont proposées. L'application à des résultats expérimentaux est assez satisfaisante.
Abstract
Summary
In order to lighten the exrperirnental work normally required by the paired comparison method, a method of comparison by blocks
and pairs is suggested. The objects dre divided into two blocks, from each which the subject makes a choice, and then the two
objects thus picked out are compared with each other (pair). To analyse the results of such a choosing procedure, a model
developed elsewhere is used and the error problem is studied : two corrective methods are proposed, iterative and logarithmic.
The application to experimental results proves quite satisfactory.
Citer ce document / Cite this document :
Flament Claude. Une méthode de comparaisons par blocs et par paires. In: L'année psychologique. 1959 vol. 59, n°2. pp. 395-
406.
doi : 10.3406/psy.1959.6640
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1959_num_59_2_6640Laboratoire de Psychologie expérimentale et comparée
de la Sorbonne
TÛKS MÉTHODE DE CÔMf»ÂRÂÏSOKS
PAR BLOCS ET MR PAIRES
par Claude Flament
Lorsqu'on veut ordonner un ensemble d'objets, On a souvent
recours à la méthode des comparaisons par paires : les n objets
étudiés, pris deux à deux, constituent n (n — l)/2 paires, qu'on
présente chacune à chaque sujet en demandant de désigner celui
des deux objets qui est le plus joli, ou le plus lourd, ou le plus
ressemblant à un étalon... (les critères d'ordonnancement peuvent
varier à l'infini !). Malheureusement, lé nombre de paires aug
mente bien plus vite que le nombre n d'objets et la méthode
devient rapidement impraticable. Torgerson (5, pp. 191-194)
indique diverses méthodes permettant dé réduire le travail
expérimental. Ces consistent, pour l'essentiel, à obtenir,
par un rapide sondage, une approximation grossière de l'ordre
recherché, et à ne présenter que les paires constituées d'objets
proches l'un de l'autre selon cet ordre. Cependant, ces méthodes
présentent diverses difficultés et ne sont pas toujours utilisables ;
par exemple, en psychologie génétique, où (du moins, on l'espère)
l'ordre varie avec l'âge, on serait amené à utiliser des paires
différentes selon les âges, ce qui gênerait la comparaison des
résultats.
Vurpillot et Brault (6) ont utilisé une méthode qu'on peut
qualifier de comparaisons par blocs et par paires : l'ensemble des n
objets est divisé en deux sous-ensembles, ou blocs, de n/2 objets
chacun, si n est pair* de (n — l)/2 et (ri -f l)/2 objets, respec
tivement, si n est impair. Chaque sujet choisit un objet dans
chaque bloc (premier choix) et ensuite, l'un des deux objets de
la paire ainsi constituée (deuxième choix). MEMOIRES ORIGINAUX 396
Par exemple, si l'on a n = 7 objets, soit : a, b, c, d, e, f, g1,
on présente le premier bloc, constitué de a, b, c et d, dans lequel
le sujet choisit, mettons, d ; puis, le second bloc (e, /, g), où le
sujet choisit e ; enfin, la paire (d, e), constituée par les premiers
choix de ce sujet, qui choisit alors d (second choix).
On fait de même avec chacun des N sujets, des blocs étant
toujours les mêmes2, mais les paires conduisant au second choix
pouvant varier d'un individu à un autre, en fonction des premiers
choix.
On peut présenter les résultats d'ensemble dans un tableau
rectangulaire, les lignes correspondant aux éléments du premier
bloc, les colonnes, à ceux du second ; chaque case est divisée
en deux : le nombre figurant dans la partie supérieure est le
nombre de fois où l'élément en tête de la colonne a été préféré
(en second choix) à en tête de la ligne et inversement
pour la partie inférieure de la case ; ainsi, e a été préféré 17 fois
à d et d, 23 fois à e.
1 TABLEAU
e bloc 2
1" 2e choix e choix f 9
\6 \1 \3 a 16 6
3\ 2\
\3 \1 \1 b 13 8
2\ 5\ 1er bloc
\18 \1 \3 c 40 18
12\ 5\
\17 d 51 32 23 \ 5\
1er choix 87 13 20 = 120 N 2e 44 4 8
Le total de toutes les valeurs d'une ligne ou d'une colonne
donne le nombre de fois où l'élément correspondant a été choisi
1. Il s'agit des 7 photos de la maison A utilisées par Vurpillot et Brault (6) ;
nous changeons leurs dénominations afin de faciliter notre exposé (on a :
a = A1 ; b = A2 ; c = A5 ; d = Ae ; e = Ai ; f = A7 et g = A8) ; on étudiera
les choix des 120 enfants de 5 ans, 6 ans et 7 ans.
2. Si les blocs sont de composition variable, les calculs que nous allons
proposer sont applicables, moyennant quelques adaptations ; mais il faut
alors utiliser toutes les combinaisons possibles. FLAMENT. COMPARAISONS PAR BLOCS ET PAR PAIRES 397 C,
dans son bloc (premiers choix : premiers totaux marginaux) ;
le total des valeurs des parties supérieures (ou inférieures) des
cases d'une colonne (ou d'une ligne), donne le nombre des
seconds choix relatifs à l'élément correspondant (deuxièmes
totaux marginaux). La considération de ces totaux marginaux
est insuffisante pour analyser le matériel ordonné : les premiers
choix ne sauraient donner qu'un classement intra-bloc, les choix
dans les deux blocs étant indépendants ; les seconds
résultent de trop de facteurs pour avoir une signification claire
(sous forme de total, du moins) ; il faut donc tenir compte de
l'ensemble des données portées au tableau ci-dessus.
Malheureusement, il n'y a pas, à notre connaissance, de
méthode classique pour exploiter les résultats d'un tel processus
de choix. On peut cependant citer une étude voisine : Guilford (4)
fait choisir un objet dans un ensemble T, ce qui correspond à
chacun de nos premiers choix ; soit nx le nombre de fois où
l'objet x est choisi dans T, N étant le nombre total de choix
(nombre de sujets); la fréquence nJN est l'estimation de la
probabilité p (x ; T) que x soit choisi dans T ; on estime de
même p (y ; T) par nyjN ; Guilford suppose alors que la pro
babilité p (x ; y) que x soit préféré à y dans une comparaison
par paire, est :
[1] p (x; y) = p (x; T)j[p (x ; T) + p (y; T)]
On est alors ramené à l'analyse d'un tableau de choix par
paires, ce qui ne présente pas de difficulté (2, pp. 62-66).
Dans notre problème, il nous suffirait donc de transformer
les premiers choix par la formule [1] ; alors, nous n'aurions plus
que des résultats (estimés ou observés) de comparaisons par
paires.
Mais cette formule [1] n'a aucune justification théorique
dans la perspective du modèle de Thurstone (le modèle classique
d'analyse des comparaisons par paires) et son utilisation expé
rimentale par Guilford lui-même a donné des résultats très
décevants.
Bradley et Terry (1), reprenant la formule [1], utilise, pour
calculer les valeurs d'échelle attribuables à chaque objet, non
pas l'intégrale de la loi normale de Gauss, comme dans le modèle
de Thurstone, mais l'intégrale de la fonction « sécante hyper
bolique au carré », ce qui nécessite des calculs compliqués, et
conduit à des résultats identiques à ceux obtenus par le modèle,
bien plus simple, que nous allons proposer. MÉMOIRES ORIGINAUX 3'98
Nous avons développé ailleurs (3) un modèle de compor
tement de choix dont on a montré que :
1° Appliqué à des données obtenues par ta méthode des
comparaisons par paires, il donne pratiquement les mêmes
résultats f à une transformation logarithmique près) que le modèle
de Thurstone ;
2° U s'applique aisément à d'autres méthodes que celle des
paires, en particulier, à celle des comparaisons par blocs et
par paires.
L'hypothèse essentielle de ce modèle tient en une formule :
[2] p (x; T) =k.u (x)
où ;
p (x ; T) est la probabilité que x soit choisi dans l'ensemble T \
k est un coefficient indépendant de x, mais non de T ;
u (x) est la valeur d'échelle (on dit aussi : utilité) de x ;
Ces valeurs sont analogues à celles obtenues par une analyse
de comparaisons par paires ; leur intérêt est d'ordonner les
objets (selon la dimension déterminée par le critère de choix
proposé au sujet) en fixant, de plus, leurs distances respectives1.
Par [2] et les règles élémentaires du calcul des probabilités,
on démontre alors que :
k = 1 / 1 u (z),
/«er
et :
[3] p(x;T) = u(x) I 1 u(x)
I sŒT
(zŒ T désigne génériquement tous les objets de T et ^ u (z)
est la somme des utilités de ces n objets) ; si T — \ x, y \ est une
paire, il en résulte que la probabilité pour que x soit préféré à y
est :
P (x.; y) « u (x)l[u (x) + u (y)]
1. La deuxième hypothèse du modèle est que u {x) est indépendant de
l'ensemble où se trouve x. Cette hypothèse est à la fois très importante et très
discutable. Mais remarquons qu'elle est faite implicitement par tous les, modèles
de mesure en psychologie. Nous ne discuterons pas ce point ici : les données
expérimentales que nous avons analysées pour Vurpillot et Brault (comme
sans doute, bien d'autres) sont telles que tout se passe comme si cette hypothèse
était vraie ; nous pensons cependant qu'elle n'est pas tout à fait exacte, mais
que les variations systématiques qui en résultent sont masquées par les varia
tions aléatoires inhérentes à tous résultats expérimentaux.. FLAMENT. COMPARAISONS PAR BLOCS ET PAR PAIRES 399 C.
On démontre alors la formule [1], et aussi la suivante :
[4] p (x; T) = 1 / X [p (z; Sxz)/p (x; SJ],
où Sxs désigne un sous-ensemble de T où x et z se trouvent
comparés, seuls (paire) ou en compagnie d'autres objets de T
(bloc).
Construisons alors une matrice carrée M, ayant n lignes et
n colonnes, correspondant a,ux n éléments de T ; dans la case
(zx), à l'intersection de la ligne (z) et de la colonne (x), portons :
[5] nizœ = P (*; Sxs)/p (x; Sx,)
(l'estimation de ces valeurs sera proposée plus loin) ; si nous
sommons les n valeurs msx de la colonne (x), on obtient :
[6] 0* = 1 \p(z, -S^lpfx; S„)];
zÇ=T
d'où, par [4] :
[7] p (x; T) = 1/0X;
on démontre alors que les utilités u (x) ne sont connaissables
qu'à un coefficient près, et peuvent être estimées par :
[8] u (x) =l.p (x; T)
£ étant un coefficient strictement positif quelconque. Ce qui
revient à dire que les utilités sont mesurées en une unité arbi
traire ; ce qui n'est pas contradictoire avec [2], puisque si l'on
multiplie u (x) par un coefficient (changement d'unité), k est
divisé par ce coefficient (v. équation [3]).
Si le sous-ensemble Sxz est présenté Nx3 fois et que x a été
choisi nx fois et y, ny fois, (on a ; ny + ny ^iVK), la meilleure est
imation des valeurs mzx de la matrice M est donnée par :
[9] mzx = p (z; S^JIp (x; Sxz) = nzjnx,
puisque :
P (z; Sxz) -= nz]Nxz, et: p (x;. S„) = nxJN„.
Reprenons les données du tableau I ; on obtient le tableau II,
qui est la matrice M.
Dans ce tableau, on a séparé d'un double trait les deux
blocs, faisant ainsi apparaître les comparaisons intra-blocs
(cadrans supérieur gauche et inférieur droit) et les comparaisons
inter-blocs (les deux autres cadrans) ; les valeurs des premières
ne sont autres que les rapports des nombres des premiers choix ; ,
1
(
1
MEMOlïlF.S ORIGINAUX 400
4,350 1,667 4,000 .650 .667 334 in OOO'I OOO'I © II CO II II II II © 1© II co c* ico in ico f -, 00 ©
1,000 6,692 1,538 1,000 5,000 2,000
230 GO OOO'I in © 00 II II || II y II II CO co © ICO in i-H Ci M co CO
1,353 1,000 1,667 .667 .149 .229 .500
180
999 = = = = = = II il in y jr» co 00 co ico co t> — Igo in ico cj Igo oo 00
.784 .739 .314 .255 200 250
co OOO'I < M in m Ci H H II II 11 co co CO CO * © f in in in 1,275 II in <
1,000 1,500 .400 .325 .600
100 f OOO'I CO = = il il II II II II CD II CO © co © © © 00 a co iin lO -H 1© If
co © Ci co © © © (35 in © o ^H -H" CO CO 00 co CO GO co © M |l II II II II II
CO CO CD co © co co iin in CO
2,500 3,187 1,000 .813 2,000 1,000 1,500
000 CO oo © II II II II II y II ro CD CD |co © CO co ici in CO CD |CO FLAMENT. COMPARAISONS PAR BLOCS ET PAR PAIRES 401 C.
les dernières, les rapports des nombres figurant dans les deux
parties des cases du tableau I ; les valeurs de la diagonale sont
forcément l'unité :
m«=p (x; S)lp (x; S) = 1.
On remarque que :
m^j = \jmyx.
Il est bien évident que les données du tableau I ayant servi
à construire le tableau II (et à calculer les p (x ; T), et les u (x)
qui en résultent par [8]) sont entachées d'erreurs d'échantillon
nage : il faudrait des effectifs bien plus grands que ceux dont
on dispose normalement, pour pouvoir considérer ces erreurs
comme négligeables.
Le problème principal de la méthode est sans doute, en effet,
celui des erreurs. On peut montrer que la sommation par colonne
minimise ces erreurs dans le cas où tous les N^ sont égaux :
c'est le cas de la méthode des comparaisons par paires où tous
les Nxy sont égaux au nombre N de sujets ; de même, ici, pour
les choix intra-blocs. Mais il est facile de voir sur le tableau II
que pour les comparaisons inter-blocs (deuxième choix), les
Njy = nx + ny sont généralement bien plus petits que N, ce
qui est tout à fait normal, mais complique le problème des
erreurs.
Pour simplifier, raisonnons sur une paire \ x, y \, dont on
fera varier le nombre N de présentations. Soient p = p (x ; y)
et q = 1 — p = p (y ; x). On devrait observer, théoriquement,
Np choix de x et Nq choix de y ; en fait, on observe respect
ivement nx = Np — d et ny — Nq +d,d étant l'erreur (inconnue) ;
on calcule alors :
X2 = *INpq [10]
Si nous présentons la même paire \ x, y j un nombre de fois
différent : N' — a.N, quelle est la valeur d' de l'erreur sur N'
aussi probable que l'erreur d sur A7 ? C'est celle qui donnera le
même x2 qu'en [10] : donc, si l'on multiplie N par a, il faut
multiplier d par va.
S'il n'y avait pas d'erreurs, la matrice M porterait la
valeur : pfq ; comme il y a des erreurs, elle porte en fait la valeur
(Np — d)l(Nq + d) ; les calculs se faisant ensuite par sommat
ion, l'erreur commise E doit s'estimer par :
p Np — cl d h = q~~ =
Nq + d q ( Nq + d) ■
1


'
:

:
;
.
'


,

!

MEMOIRES ORIGINAUX 402
2,183 3,783 1,107 1,173
14,246 4,350 1.000 .650 .070
== = = =
164 CO lO 00 in GO t> co 00 Ci
t> Ci CO l op in Ci <3 oe *-* O3 O CO 00 S CO in °^ II 1 II CO 1— t Ci Ci II .°D.
y>- CO oo. lQ 00. oo in GO 2 lO oo,
1,567 .461 .489
OS o CD
it. H- Ci: It IT q Ci ii II •"■< Ci II 164 180 180 co CO 282 180 00 08 oo 1
CD CO. m CO o CO Ci Ci co; o .314 .255 .784 O5 cp Tf ©_ 1} ! Il II CO 180 282 -3 .58 in r-. 282
1
co O2 in
lO: c> o lO ~ S o oo Ci co iO tl II. ÇP Ci h o^ II CO || in 164 180 CO;
in os Ci 2,0 co' 00" L2,787 1,231 3,077 1,000 3,923 .078
= II II
o in 00 oo 00 1.0 C^ 00 oo co 00 oo
os CO os. © .,272 CD ,500 ,187 813 a>
000' II II Ci co o co 00 in co oo oo 00 FLAMENT. COMPARAISONS PAR BLOCS ET PAR PAIRES 403 C.
et, en faisant varier N,. on obtient :
Jl/„ ri
E' = [11]
q (Nq<z -f d s/ol) q (Nq \Jcn + d)
On voit donc que quand a diminue (c'est-à-dire, le nombre
de présentations), l'importance de l'erreur (en valeur absolue)
augmente, la probabilité de cette erreur étant constante ; cette
croissance est hyperbolique en fonction de y a,
II en résulte en particulier que les calculs effectués plus haut
donnent trop d'importance aux comparaisons inter-blocs. Deux
méthodes de correction peuvent être proposées.
Correction itérative. — Ayant calculé, comme précédemment,
une première estimation (assez mauvaise) des p (x ; T), on
remplace dans la matrice M, les valeurs obtenues sur de trop
faibles effectifs par le rapport des dits p (x ; T) et on recommence
les calculs. Ceci revient à donner plus de poids aux choix obtenus
sur de forts effectifs, c'est-à-dire, ici, au choix inter-blocs (qui
interviennent cependant encore de façon considérable).
Le tableau III indique les calculs de correction itérative à
partir des valeurs trouvées au tableau II. Les valeurs întra-bloes
ont simplement été recopiées du tableau II ; les valeurs inter
blocs sont estimées par le rapport correspondant des p (x ; T)
du tableau II (multipliées par mille, pour simplifier l'écriture).
Nous avons dit que cette correction itérative devait être
faite pour les cases d'effectifs faibles, ce qui est le cas de la
plupart des comparaisons inter-blocs, mais pas de toutes. II ne
semble pas y avoir d'inconvénient à effectuer systématiquement
la correction : l'étude d'un grand nombre de résultats expér
imentaux nous a démontré que l'importance de la correction
tend à décroître lorsque les effectifs croissent, pour être prat
iquement inexistante lorsque iV^ dépasse 60 ou 80 ; cette tendance
confirme l'adéquation de l'étude mathématique des erreurs.
Remarquons que le total des p ( x ; T) du tableau III est
de : .988 (au lieu de : .930 dans le tableau \\) ; ce qui est un
indice de la réduction des erreurs (on se rapproche du total
théorique, qui est l'unité).
Cette méthode itérative est très analogue à celle utilisée
en analyse factorielle pour l'estimation des communautés.
Malheureusement, on peut montrer qu'ici, l'itération n'est pas
convergente (c'est-à-dire, que sa répétition ne finit pas par
annuler les erreurs).

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.