Quelques applications de la théorie de l'information à la construction des échelles d'attitudes - article ; n°1 ; vol.56, pg 47-57

De
Publié par

L'année psychologique - Année 1956 - Volume 56 - Numéro 1 - Pages 47-57
11 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : dimanche 1 janvier 1956
Lecture(s) : 12
Nombre de pages : 12
Voir plus Voir moins

S. Moscovici
G. Durain
Quelques applications de la théorie de l'information à la
construction des échelles d'attitudes
In: L'année psychologique. 1956 vol. 56, n°1. pp. 47-57.
Citer ce document / Cite this document :
Moscovici S., Durain G. Quelques applications de la théorie de l'information à la construction des échelles d'attitudes. In:
L'année psychologique. 1956 vol. 56, n°1. pp. 47-57.
doi : 10.3406/psy.1956.8845
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1956_num_56_1_8845NOTES
QUELQUES APPLICATIONS
DE LA THÉORIE DE L'INFORMATION
A LA CONSTRUCTION DES ÉCHELLES D'ATTITUDES
par Serge Moscovici et Geneviève Durain
Dans une livraison précédente de cette même publication (1), nous
avons exposé les principes et l'importance de l'analyse hiérarchique en
tant que technique de construction des échelles d'attitudes. La pratique
a montré qu'elle est en fait une technique assez générale d'analyse des
variables si on les prend une à une, donc elle n'est aucunement limitée
au seul domaine des attitudes. Cependant, la pratique a aussi fait voir
que le concept central, sur la base duquel était estimée la signification
statistique d'une échelle, le concept de reproductibilité, n'était pas
satisfaisant. Cet article a pour but d'en montrer les limitations et de
proposer une modalité plus rationnelle de définition statistique d'une
échelle.
I. — Rappel des principes de l'analyse hiérarchique
La construction d'échelles d'attitudes en psychologie sociale se
propose d'une part de mesurer une certaine forme de comportement et
d'en prédire le développement, et d'autre part de distinguer des groupes
d'individus,
II s'agit donc à la fois de définir des comportements — en réalité
sous leur aspect symbolique — et des types, en faisant l'hypothèse
qu'entre comportement et type il existe une liaison, une variable qui
peut être l'attitude, la connaissance, etc.
Le modèle qui se trouve à la base de l'analyse hiérarchique est
construit en partant des caractères manifestes de l'attitude,
Malgré les divergences des définitions de celle-ci, il y a un certain
nombre de caractères communs qui permettent de passer de la théorie
à la mesure.
Le premier caractère est la latence de l'attitude. On reconnaît en
général que les réponses à une série de questions sont liées entre elles,
c'est-à-dire qu'elles sont cohérentes, et l'on explique cette cohérence 48 NOTES
manifeste par l'existence d'une variable, d'un « facteur commun », qui est
leur principe organisateur. L'existence d'une attitude se déduit donc de la
covariation d'un certain nombre de réponses.
Le deuxième caractère est l'existence d'un sens des réponses dans une
population donnée. Autrement dit, une attitude a un sens positif ou
négatif et dans une population on rencontre des sujets dont les réponses
peuvent être classées du positif au négatif.
Le troisième caractère commun à toutes les définitions, c'est qu'elles
considèrent qu'il existe un rapport entre la conduite symbolique- verbale
d'un sujet et sa conduite réelle, autrement dit qu'on peut passer de la
définition d'une à sa prédiction ; l'attitude est à la fois une
conduite et un segment de conduite et de ce fait elle permet la prédiction.
Par là même, les conditions de mesure d'une attitude se trouvent
précisées. En premier lieu, il s'agit d'établir la consistance interne des
réponses, c'est-à-dire la relation ou la corrélation qui existe entre elles.
En deuxième lieu, les extrémités positif-négatif doivent être les
extrémités de la même chose, d'une même variable, de la même attitude,
autrement dit l'instrument de mesure doit être unidimensionnel.
Enfin, on doit pouvoir donner des notes qui discriminent les sujets
entre eux, en vue de l'étude de la fidélité et de la validité de l'échelle.
Dans l'analyse hiérarchique, on dit qu'il y a unidimensionnalité
lorsqu'il existe un modèle de consistance des réponses qui nous permet de
situer d'une manière non ambiguë les sujets le long d'un continuum.
Supposons qu'on veuille construire une échelle d'attitudes à l'égard
de l'analyse hiérarchique et que l'on ait obtenu les résultats suivants à
trois questions posées :
1. Êtes- vous pour ou contre la psychologie sociale ?
Pour : 40 % Contre : 60 %
2. Êtes-vous pour ou contre la mesure en psychologie sociale ?
Pour : 30 % Contre : 70 %
3.pour ou contre l'analyse hiérarchique ?
Pour : 20 % Contre : 80 %
On peut inscrire les réponses à ces questions, prises deux à deux, dans
des « cellules » semblables à celles qu'on utilise pour calculer des coeffi
cients tétrachoriques ou de contingence.
Questions 1 et 2 Questions 2 et 3
+ 1 — + 2 —
30 0 30 20 0 20
10 60 70 10 70 80
40 60 30 70 MOSCOVICI ET G. DURAIN. — LA THÉORIE DE l'iN FORM ATION 49 S.
Le modèle de consistance apparaît du fait qu'il n'y a pas de sujet qui
puisse être à la fois contre la psychologie sociale et pour la mesure en
psychologie sociale, et qu'il n'y a pas de sujet qui soit à la fois contre la
mesure en psychologie sociale et pour l'analyse hiérarchique.
Si l'on poursuit cette analyse, on trouve quatre types de sujets :
a) Ceux qui répondent « pour » aux trois questions ;
b)qui « » aux deux premières, « contre » à la
dernière ;
c) Ceux qui répondent « pour » à la première, « contre » aux deux
dernières ;
d) Ceux qui « contre » aux trois questions.
Il n'y a pas d'autres types de sujets, ou bien ils ne peuvent être
définis sans ambiguïté sur cette dimension.
Les mêmes types de réponses peuvent être ordonnés sur un modèle
qui est le modèle parallélogrammatique :
P2 P3 Pi c3 c2 Ci
3 X X X X X X
2 X X X X X
1 X X X X
0 X X X
De cette façon, on peut attribuer à chaque sujet une note de rang
allant des plus favorables à l'analyse hiérarchique aux moins favorables.
Aussi, quand on dit qu'un sujet a une note, par exemple 1, on dit,
non seulement qu'il a répondu favorablement à une question, mais aussi
à quelle question il a favorablement.
Tout sujet qui a répondu autrement n'est pas « cohérent », n'est pas
un type de cette échelle.
La note indique ici à la fois le rang du sujet et le contenu de sa
réponse et en partant du rang d'un sujet on peut dire ce qu'il a répondu ;
inversement à partir des réponses d'un sujet on peut déterminer son rang.
Cette propriété fondamentale de l'échelle s'appelle la reproductibilité.
Le présent travail s'efforce d'examiner ce concept et le rôle qu'il
joue dans l'analyse hiérarchique.
II. — La reproductibilité : importance et limites
Le concept de a été à la base de l'étude statistique
des échelles.
Lorsqu'on construit une échelle, il y a toujours un nombre plus ou
moins grand de sujets dont les réponses s'écartent de « ce qu'elles
auraient dû être », c'est-à-dire du modèle parallélogrammatique, et le
degré de prédictibilité dépend du nombre de ces erreurs.
A. PSYCIIOL. 06 4 NOTES 50
Cependant, dans le cas de données qualitatives, il est difficile de
considérer les erreurs comme des erreurs linéaires, indépendantes les
unes des autres, car il est difficile de préciser si les relations mêmes entre
les questions sont de nature linéaire. Dans le cas d'une approche struc
turale, cas qui est celui de l'analyse hiérarchique, il faut considérer
Vensemble des « bonnes » réponses et Vensemble des « erreurs » comme
deux groupes dont l'un constitue un modèle et l'autre l'écart par rapport
à ce modèle. Car il faut supposer que, si l'on a un grand nombre de
sujets, les erreurs ne seront plus des erreurs « au hasard », mais la mani
festation de l'existence d'un autre modèle. La présence des erreurs dans
une échelle signifie la présence de types de réponses qui sont connexes ou
situés en dehors de l'échelle, donc de déviations.
Lorsqu'on dit que la reproductibilité d'une échelle est parfaite, cela
veut dire que les déviations sont nulles et qu'il n'y a qu'une dimension
et une seule.
La mesure de la reproductibilité est la suivante :
nombre d'erreurs
W 1 nombre de questions x nombre de sujets
Signalons encore deux connotations de la notion de reproductibilité.
La première a trait à la relation entre une série de variables qualitatives :
les questions et leurs catégories, et la variable quantitative : le rang. La
note de rang est une fonction simple de l'organisation des réponses et
réciproquement. On suppose donc une sorte d'isomorphisme entre des
variables de nature différente.
La deuxième a trait au rapport entre un modèle « idéal » et sa réali
sation concrète. En pratique, on trouve rarement des échelles parfaites
et elles ne peuvent être considérées que comme des modèles dont une
échelle et ses déviations représentent les réalités concrètes.
C'est dans cette réalisation d'un modèle que la notion de reproduct
ibilité trouve ses limites. En effet, si une échelle présente trop de déviat
ions, on ne peut plus parler de « consistance interne » des réponses, mais
nous savons que, dans ce cas, la note de rang conserve encore sa valeur.
L'isomorphisme des variables se dissout et ce qui reste est l'existence
d'une communauté entre les questions, c'est-à-dire un facteur défini
qualitativement. Le coefficient de reproductibilité devient à ce moment-
là d'une utilité moindre puisqu'il est basé sur la population des réponses
et non pas sur la population des sujets, l'isomorphisme de ces deux
populations (sujets et réponses) diminue.
A côté de la consistance des réponses, il faut envisager Yhomogénéité
de la population des sujets. C'est une grave erreur des statisticiens que
d'avoir envisagé uniquement la consistance des réponses sans étudier
l'homogénéité des populations, car celle-ci n'est en fait qu'un indice du
degré de réalisation de celle-là.
La conclusion provisoire à laquelle nous voulons arriver est la
suivante : dès qu'on est en présence d'une échelle qui s'éloigne nota- MOSCOVIGI ET G. DURAIN. LA THÉORIE DE l'iN FORM ATION 51 S.
blement de la perfection, ou d'une quasi-échelle, la notion de reproduc-
tibilité perd toute validité opérationnelle. Il faut alors estimer sépa
rément la consistance et l'homogénéité de l'échelle.
III. — Coefficients de consistance et d'homogénéité
d'une échelle
Le coefficient de reproductibilité proposé par Guttmann est purement
empirique. Il n'est qu'une façon différente de calculer des rapports entre
pourcentages. Son auteur a renoncé récemment à ce coefficient (2).
On peut le remplacer par des coefficients qui utiliseraient les « cellules
de contingence » ou des techniques dérivées. L'on introduit ainsi l'idée
de corrélation des questions prises deux à deux. Mais aucune de ces
techniques ne traite l'échelle comme un tout, ce qui revient à introduire
des courantes qui sont en contradiction fondamentale avec les
principes structuraux de l'analyse hiérarchique. Ces statistiques sont
néanmoins d'une utilité certaine, même si elles ne nous aident pas à
pénétrer plus avant dans l'élucidation théorique des notions d'échelle,
d'unidimensionnalité, etc. L'empirisme du coefficient de Guttmann ne
serait pas un obstacle si celui-ci était assez fin, malheureusement ce n'est
pas le cas.
Supposons que nous ayons deux échelles ayant toutes deux un GR
de .90. Nous savons ainsi quel est le nombre d'erreurs de chacune, mais
nous ne pouvons guère les comparer. En effet, si les erreurs de la première
sont réparties sur 30 sujets et les erreurs de la seconde sur 60 sujets, il est
évident — si l'on tient compte du nombre total de sujets — que la
première a une reproductibilité plus élevée que la seconde. En d'autres
termes, cela veut dire que la population est plus homogène dans le
1er cas.
Nous faisons ici l'hypothèse que la consistance interne des questions
est donnée parle rapport entre le nombre d' « erreurs » et le nombre de
« réponses correctes », et Yhomogénéité de la population de sujets d'une
échelle par le nombre de sujets sur lesquels ces erreurs sont réparties.
A la lumière de cette hypothèse, il est bien évident que deux échelles
peuvent avoir la même consistance interne, mais des homogénéités
différentes.
a) Le coefficient de consistance
Ce coefficient, comme celui d'homogénéité que nous allons étudier
plus loin, est fondé sur la théorie de l'information (3, 4, 5).
Divers auteurs ont montré qu'on peut l'appliquer en psychologie
(6, 7, 8) et à des problèmes spécifiques de construction d'échelles de
jugement absolu (9). Nous ne reviendrons pas ici sur cette théorie qui a
été exposée dans L'Année Psychologique d'une manière très satisfaisante
par MM. Bresson et Favergo. 52
Rappelons seulement qu'on peut, d'une part définir en partant d'une
échelle des réponses la quantité des réponses fournies :
Ir = - [— SN,- . log2 N/ + N log2 N] (1)
et l'erreur sur ces réponses :
E, [- SSNfc log * + SN . k log2 N . fc] (2) ^
La formule de Ir et Er d'après Garner et Hake est donnée en note1.
Supposons une échelle de six questions auxquelles ont répondu
100 sujets et que l'on ait 60 erreurs. On peut construire la matrice
suivante :
Oi Q2. Qi Q5 Q6
89 89 +
Qi....
— 11 11
90 90 + ! Q.....
10 10
91 91 +
9 9
89 89 +
— 11 11
91 91 + \
) - 9 9
90 90 +
Q«....
— 10 10
100 100 100 100 100 100 600
lr = — [ — 89 log2 89 — 11 log2 11 — 90 log2 90 — 10 log2 10
— 91 log2 91—9 log2 9 — 89 log2 89 — 11 log2 11
— 91 log2 log2 9 — 90 log2 90 — 10 log2 10
+ 600 log2 600]
1. Les deux indices Ir, la quantité de l'information et Er, l'erreur sur
celle-ci ont été définis par Hack et Garner (9) dans leur article sur l'application
de la théorie de l'information à l'étude des jugements. Le lecteur qui s'intéresse
à cet aspect plus technique est prié de s'y rapporter.
La seule modification réside dans la façon dont nous avons calculé Ir et Er MOSCOVICI ET G. DURA1N. LA THÉORIE DE l'iN FORM ATION 53 S.
Er = C~~ 89 l0g2 89 ~ U l0g2 ll ~~ 9° l0g2 9° ~" 10 l0g2 10
6ÏÏ0
— 91 log2 91—9 log2 9 — 89 log2 89 — 11 log2 11
— 91 log2 91 — 9 log2 9 — 90 log2 90 — 10 log2 10
+ 6 (100 log2 100)]1
Le coefficient de consistance est :
Go = l-f-r (3)
Ce coefficient nous renseigne seulement sur la quantité d'information
fournie par l'échelle en partant d'un groupe de questions. La reproduc-
tibilité est d'autant plus grande que 1' « erreur » sur cette information est
plus petite.
Il peut remplacer utilement le coefficient de Guttmann car il présente
les mêmes propriétés que celui-ci.
a) II varie parallèlement au coefficient de reproductibilité. Par exemple :
CH = 1 Go - 1
CR= .90 Cc= .85
CR = .87 Cc = .84
b) Ses fluctuations ne sont pas fonction de la répartition du nombre
d'erreurs par sujet.
Par exemple, pour une même échelle, si on répartit le même nombre
d'erreurs :
Sur 20 sujets GR = .90 Gc = .85
— 40 — GR = .90 Cc = .85
c) II semble ne pas varier avec le nombre de sujets dans la population.
Une même échelle faite sur 60, 100 et 200 sujets donne la même
valeur de Gc. Ce à quoi il fallait s'attendre.
en utilisant les statistiques de J.-M. Faverge qui propose d'employer les
fréquences au lieu des probabilités.
Dans ce cas :
Er = — Sp (ft) Spfc (/) log2 pk (/)
k j
= [- ESN» log2 N» + SN . k log2 N . k] -jj
lr = — Sp (/) log2 p (/)
i
N,- [- SN,- . log2 + N log2 N] = -jj
N/ = nombre de réponses dans une ligne
Njf — de une colonne
N/fc = nombre d'événements dans une cellule.
On doit retenir le fait que la théorie de l'information n'exige pas et ne
prouve pas le fait que les réponses doivent se trouver ou se trouvent sur un
même continuum. La façon dont cette hypothèse est vérifiée dans l'analyse
hiérarchique a été exposée ailleurs (1).
1 . On ne doit pas diviser par -^ car les deux valeurs Er et Ir dans le rapport
restent les mêmes. 54 NOTES
d) Gomme le coefficient de Guttmann, il varie en fonction du nombre
de questions sur lesquelles sont réparties les erreurs.
Le même nombre d'erreurs réparties sur trois questions donne un
Cc = .88, sur quatre questions Go = .86, et sur six Gc = .84.
Le calcul de ce coefficient est rapide, et les bases sur lesquelles il
repose sont d'ordre statistique. Son rôle est de distinguer une échelle
parfaite d'une quasi-échelle, c'est-à-dire de définir le degré de consistance
des réponses pour une population donnée. Cette consistance est donnée
par le rapport entre 1' « erreur » et la quantité de l'information. Mais
comme le coefficient de Guttmann, il ne saisit qu'un aspect de l'échelle ;
le deuxième, qui est la variation des modèles d'erreurs dans une popu
lation de sujets, c'est-à-dire l'homogénéité, implique l'intervention d'une
deuxième mesure statistique.
b) Le coefficient d'homogénéité
La méthode d'obtention de ce coefficient est une méthode beaucoup
plus générale que la précédente. Elle est applicable à tout modèle, à
toute analyse de modèle de réponse. Elle est due à M. Faverge et fait
suite à une série de travaux qu'il a effectués au sujet de l'application de la
théorie de l'information en psychologie (10).
Elle part de deux constatations :
— la première concerne la possibilité de décomposer l'entropie totale
d'information H en une entropie intergroupe Ug et une entropie
intragroupe H^ :
H=H?+Hi (1)
— la deuxième suppose qu'on peut exprimer les réponses favorables
et les réponses défavorables par une suite de chiffres du système
binaire 1 et 0.
Par exemple : 0 1 1 1 1 1.
Le raisonnement qui sous-tend l'application de cette méthode dans
le cas des échelles est le suivant :
On peut constituer — - étant donné un ensemble de sujets — un
certain nombre de classes où tous les sujets donnent le même type de
réponse. Ce premier mode de répartition nous permet de calculer H.
Ensuite, en groupant toutes les classes ayant un seul 1, c'est-à-dire
une seule réponse favorable, puis les classes qui ont deux 1, etc., on
obtient une répartition moins fine (dans notre cas en 7 classes en comp
tant zéro) à l'aide de laquelle on calcule Hg,
Dans le cas d'une échelle parfaite :
H = H, (2)
car Hj sera nul. Il sera nul pour des raisons évidentes. Supposons le type
de réponse 10 0 0 0 0. C'est la « bonne » réponse de l'échelle. Les types
de déviations suivants sont possibles :

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.