Information sur le niveau de performance et apprentissage avec renforcement aléatoire - article ; n°1 ; vol.72, pg 65-80

De
Publié par

L'année psychologique - Année 1972 - Volume 72 - Numéro 1 - Pages 65-80
Résumé
Dans deux expériences d''apprentissage de probabilité, les différents groupes de sujets reçoivent une information cumulée sur certaines caractéristiques de leur performance ou de la suite des événements à prédire. Cette information est apportée soit essai par essai, soit après chacun des S blocs de 54 essais. L'information sur la fréquence des réponses exactes a un effet facilitateur tandis que l'information sur la fréquence de renforcement de chacune des deux réponses freine l'apprentissage.
Summary
In two probability learning experiments, fifteen groups of Ss. received cumulative information either about some characteristics of their performance or about the series of events which they had to predict. This information was given to the S. either trial by trial or after each of the 8 blocks of 54 trials each. Information about frequency of correct responses had a facilitatory influence on learning whereas information about the frequency of reinforcement of each response had a inhibitory influence.
16 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : samedi 1 janvier 1972
Lecture(s) : 8
Nombre de pages : 17
Voir plus Voir moins

Georges Guillain
Information sur le niveau de performance et apprentissage avec
renforcement aléatoire
In: L'année psychologique. 1972 vol. 72, n°1. pp. 65-80.
Résumé
Dans deux expériences d''apprentissage de probabilité, les différents groupes de sujets reçoivent une information cumulée sur
certaines caractéristiques de leur performance ou de la suite des événements à prédire. Cette information est apportée soit essai
par essai, soit après chacun des S blocs de 54 essais. L'information sur la fréquence des réponses exactes a un effet facilitateur
tandis que l'information sur la fréquence de renforcement de chacune des deux réponses freine l'apprentissage.
Abstract
Summary
In two probability learning experiments, fifteen groups of Ss. received cumulative information either about some characteristics of
their performance or about the series of events which they had to predict. This was given to the S. either trial by trial
or after each of the 8 blocks of 54 trials each. Information about frequency of correct responses had a facilitatory influence on
learning whereas information about the frequency of reinforcement of each response had a inhibitory influence.
Citer ce document / Cite this document :
Guillain Georges. Information sur le niveau de performance et apprentissage avec renforcement aléatoire. In: L'année
psychologique. 1972 vol. 72, n°1. pp. 65-80.
doi : 10.3406/psy.1972.27929
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1972_num_72_1_27929Laboratoire de Psychologie expérimentale et comparée
de la Sorbonne associé au CNRS de de l'Université de Rouen
INFORMATION SUR LE NIVEAU DE PERFORMANCE
ET APPRENTISSAGE
AVEC RENFORCEMENT ALÉATOIRE
par Christian George1
SUMMARY
In two probability learning experiments, fifteen groups of Ss. received
cumulative information either about some characteristics of their perfor
mance or about the series of events which they had to predict. This informat
ion was given to the S. either trial by trial or after each of the 8 blocks of
54 trials each. Information about frequency of correct responses had a
facilitatory influence on learning whereas information about the frequency
of reinforcement of each response had a inhibitory influence.
Dans la procédure usuelle des expériences de prédiction en
situation aléatoire (plus communément appelées « apprentissage
de probabilité »), chaque essai comporte tout d'abord une réponse
d'un sujet prédisant lequel de plusieurs événements possibles sur
viendra peu après, puis la réalisation effective de l'un de ces
événements ou issues2. Essai par essai le sujet est ainsi informé
directement de chaque nouvelle issue, qui constitue la « bonne
réponse », et indirectement de l'exactitude de chaque réponse
effectuée. A ces informations « ponctuelles » on peut opposer des
1. Avec la collaboration de G. Amy, M.-D. Gineste, G. Paris pour l'expé
rience I ; et celle de C. Baron, C. Charvet, M.-C. Duflls et G. Faura pour
l'expérience II.
2. Pour le lecteur non averti, signalons brièvement que l'ordre de suc
cession des issues est imprévisible puisqu'il obéit à une règle probabiliste.
Dans les cas simples généralement étudiés, la probabilité d'une issue à un
essai donné ne dépend ni du rang de l'essai, ni de la réponse ou de l'issue
précédentes.
a. psychoi,. 72 3 66 MÉMOIRES ORIGINAUX
informations « cumulées », se référant à la valeur prise par cer
taines caractéristiques de la suite des issues ou de la suite des
réponses pendant n essais. Cette information cumulée pourrait
être communiquée soit périodiquement après des blocs compor
tant un nombre défini d'essais, soit à chaque essai ; et elle pourr
ait porter soit sur un nombre limité et constant d'essais anté
rieurs soit sur l'ensemble des essais antérieurs. Notons qu'un
sujet pourrait traduire une information ponctuelle en info
rmation cumulée si la première était stockée intégralement en
mémoire ou sur un support externe, ce qui n'est habituellement
pas le cas.
L'effet de ces informations cumulées n'a guère été étudié
dans les expériences de prédiction en situation aléatoire. Or l'une
d'elles est particulièrement importante, l'information sur le
nombre ou la fréquence des réponses exactes, puisqu'elle est
directement pertinente à la tâche des sujets ; en effet, les consignes
impliquent généralement une maximisation du nombre des
réponses exactes, soit explicitement, soit implicitement. A notre
connaissance une seule étude a envisagé ce problème. Das (1961)
a réalisé une expérience de prédiction portant sur 125 essais et
deux issues possibles, les mots « non » et « oui » dont la probabilité
d'apparition est respectivement 0,75 et 0,25. Tous les sujets
doivent inscrire leurs prédictions à gauche, et les issues à droite
de la feuille de réponse. Après chaque bloc de 25 essais ils doivent
tourner la page de leur cahier de réponse, l'expérience étant
interrompue pendant une minute. Outre un groupe contrôle,
il y a deux groupes expérimentaux qui reçoivent une info
rmation cumulée sur leur niveau de performance. Les sujets du
groupe R25 comptent le nombre de réponses exactes après chaque
bloc de 25 essais, tandis que ceux du groupe R5 les comptent par
blocs de 5 puis les totalisent par blocs de 25 essais. La fréquence
des prédictions de l'issue majoritaire pour les 25 derniers essais
est de 0,73, 0,67 et 0,79 pour les groupes contrôle, R25 et R5.
L'ordre observé paraît difficilement interprétable.
L'effet facilitateur de la connaissance des résultats sur
l'apprentissage, notamment dans les tâches sensorimotrices,
est connu depuis longtemps. Ce n'est que récemment qu'on a
tenté d'analyser cet effet en dissociant une fonction d'indice
(information sur la nature et l'ampleur des erreurs par exemple)
et une fonction motivationnelle (inviter le sujet à maintenir ou
à accroître son effort par exemple) (Bilodeau, 1966 ; Locke et al., C. GEORGE 67
1968). Dans les expériences de prédiction en situation aléatoire,
l'information ponctuelle a évidemment une fonction d'indice,
et accessoirement une fonction motivationnelle. S'il s'avère
aussi qu'une information cumulée est efficace, il faudra se
demander pourquoi ; et un tel résultat pourrait entraîner quelques
difficultés pour les notions de renforcement et de réponse dans
une perspective S-R traditionnelle (par exemple, si une info
rmation cumulée a un effet facilitateur sur l'apprentissage,
comment définir la « réponse » renforcée ?).
Une étude de ces problèmes qui n'a qu'un caractère explorat
oire a été envisagée dans les deux expériences relatées ci-après.
Dans l'expérience I une information cumulée est apportée essai
par essai (elle concerne chaque fois l'ensemble des essais anté
rieurs) au moyen de compteurs totalisateurs placés dans le champ
visuel du sujet, tandis que dans l'expérience II elle est apportée
après chacun des huit blocs de 54 essais (elle concerne seulement
les essais englobés dans chacun de ces blocs). L'information
cumulée est relative soit à la fréquence de toutes les réponses
exactes sans distinction (information FRE), soit à d'autres
fréquences plus complexes, comme par exemple la fréquence des
réponses 1 exactes calculée par rapport au nombre de réponses 1
effectuées et simultanément la fréquence des réponses 2 exactes
par rapport au nombre de réponses 2 effectuées ; cette dernière
information, duale, indique la probabilité de renforcement des
deux réponses possibles (information PRf).
EXPÉRIENCE I
MÉTHODE
Convention
Dans ce qui suit, on désignera les deux événements à prédire, ou
issues, par ix et t2 ; les deux réponses possibles, par rt et r2 ; la probabilité
des issues, par nx et tt2 ; la fréquence des deux réponses par /j et /2.
L'indice 1 se rapporte toujours à l'issue majoritaire ou à la prédiction
de l'issue majoritaire.
Matériel
II est constitué par un appareil de présentation automatique de
signaux et d'enregistrement des réponses1. Les signaux et les réponses
1. Nous remercions vivement le Pr Benzecri, de l'Institut de Statistiques
de l'Université de Paris, qui a bien voulu nous prêter cet appareil. MEMOIRES ORIGINAUX 68
sont inscrits sur une bande perforée. Cet appareil est connecté à trois
« périphériques » placés devant le sujet : un panneau comportant deux
ampoules distinguées par leur position spatiale, l'une à droite, l'autre à
gauche ; une boîte avec deux clefs de réponse, à droite et à gauche,
venant se placer en avant et au-dessous du panneau ; un bloc de six
compteurs disposés conformément à la figure 1 et donnant immédiate
ment après chaque réponse les informations suivantes :
1. Nombre de réponses exactes droite et gauche ;
2. — — gauche ;
3. — — droite ;
4. Nombre de réponses gauche ;
5. — droite ;
6. —et gauche.
L'allumage de l'ampoule de droite et de celle de gauche constitue
les deux issues. Le dispositif est programmé de telle façon qu'une
réponse fait avancer d'un pas la bande perforée où est inscrite la suite
Sri exactes 2ri+r2 exactes
Fig. 1 (expérience I). — Disposition des compteurs totalisateurs avec
leur contenu (on considère ici le cas où l'issue majoritaire apparaît à gauche,
rx désignant la prédiction de celle-ci). Les du bas totalisent
seulement les réponses exactes, tandis que les compteurs du haut totali
sent toutes les d'une classe déterminée, exactes et inexactes. Le
contenu du compteur 1 est la somme des compteurs 2 et 3, celui du compt
eur 6 la somme des compteurs 4 et 5.
des issues, commandant l'allumage de l'une des deux ampoules une
seconde après. L'expérience est ainsi autocadencée, l'appareil n'impo
sant aucune autre contrainte sur le temps de décision.
La série des issues
On a engendré la série des issues des 432 essais avec 7rx = 2/3 et
7Ta = 1/3 (aléa binomial). En utilisant des procédures indiquées par
ailleurs (George, 1971), on a veillé à ce que le nombre de files de 1, 2,
3, ..., k issues 1 ou de 1, 2, 3, ..., k issues 2 soit une approximation aussi C. GEORGE 69
satisfaisante que possible de l'espérance mathématique de ces nombres.
En outre, dans chaque bloc de 108 essais, la fréquence des i\ et des i2
est conforme à leur probabilité, ainsi que la des couples
d'issues 11, 12, 21, 22.
Plan expérimental
Neuf groupes indépendants de 10 sujets reçoivent une information
variable selon le nombre et la nature des compteurs mis à leur dispos
ition. Ils sont désignés par les numéros de ces compteurs : contrôle
(aucun compteur), 16 (compteurs 1 et 6), 23, 45, 14, 26, 145, et 236,
2345 (se reporter à la fig. 1). La mise en relation des compteurs dispo
nibles permet d'obtenir une ou plusieurs proportions ayant un degré
de pertinence variable par rapport à la tâche. On peut noter que par
rapport à un type défini d'information, FRE ou PRf, certaines combi
naisons de compteurs apportent des indications suffisantes ou insuffi
santes. Ainsi 16 permet d'évaluer FRE, 2345 permet d'évaluer FRE
(la sommation des deux compteurs supérieurs et celle des deux compteurs
inférieurs ramenant à la condition 16) et PRf (en mettant en rapport les
deux compteurs de gauche d'une part, les deux compteurs de droite
d'autre part) tandis que 23 et 45 ne permettent d'évaluer ni FRE
ni PRf.
Dans chaque condition expérimentale l'issue majoritaire apparaît
à gauche pour la moitié des sujets, à droite pour l'autre moitié. La
passation est individuelle.
Les consignes
Elles sont identiques pour tous les groupes à cette différence près
qu'on ne fait aucune référence aux compteurs dans le groupe contrôle,
et qu'on mentionne seulement les effectivement disponibles
dans les autres groupes. Après avoir présenté le matériel, l'expérimen
tateur dit au sujet :
« Vous allez participer à une expérience de prédiction avec 432 essais.
A chaque essai un signal lumineux va apparaître soit à droite soit à
gauche. Votre tâche est de prédire, essai par essai, lequel de ces deux
signaux sera présenté.
« Vous indiquerez votre prédiction en appuyant sur le bouton de
droite pour prédire l'apparition du signal droit et sur le de
gauche du gauche.
« A chaque essai, le signal n'apparaît qu'après votre prédiction et
toujours une seconde après celle-ci. Quand le signal apparaît vous
pouvez vérifier si votre prédiction pour cet essai était exacte ou inexacte.
A chaque essai vous pouvez prendre votre décision sans que l'appareil
ne vous impose de contrainte temporelle. Vous déterminez donc vous-
même la cadence de l'expérience. Ne consacrez cependant pas trop MÉMOIRES ORIGINAUX 70
de temps à chaque décision car vous aurez 432 prédictions à faire.
« La succession des 432 signaux dans la série résulte d'un tirage au
sort. On a placé dans une urne des jetons marqués « droite » et des
jetons marqués « gauche », dans une proportion qui vous est inconnue,
cette proportion ne variant pas d'un tirage à l'autre. En effet chaque
jeton tiré est aussitôt remis dans l'urne dont on brasse le contenu
entre chaque tirage. On a procédé ainsi à 432 tirages ; l'ordre de
succession des signaux dans la série correspond au résultat de ces
432 tirages.
« Avez- vous des questions ?
« II n'existe donc aucune loi, aucune règle systématique vous per
mettant de déterminer avec certitude quel sera le prochain signal
présenté. Il est donc impossible de faire une prédiction exacte à chaque
essai. Cependant, vous pouvez augmenter, au cours de l'expérience,
le nombre de vos prédictions exactes. Vous pouvez faire en moyenne
plus d'une prédiction exacte sur deux.
« (Pour vous aider dans cette tâche, ces compteurs vous indiquent :
1. Le total de vos prédictions exactes droites ou gauches ;
2. — — gauches exactes ;
3. — — droites ;
4. — — gauches exactes ou inexactes ;
5. — — droites ou ;
6. — —ou gauches exactes ou inexactes.
« Vous pouvez à tout moment consulter ces compteurs. Ils vous
donneront une information qui vous aidera à augmenter le total de vos
prédictions exactes.)
« Avez-vous des questions ?
« En résumé, sachant que la succession des signaux résulte d'un
tirage au sort dans une urne, vous devez faire le maximum de prédic
tions exactes sur l'ensemble de l'expérience.
« Les compteurs vous apportent une information qui vous permet
d'augmenter le nombre de vos prédictions exactes.
« Faites votre première prédiction. »
Les sujets
90 étudiants volontaires en première année d'étude de psychologie
à Paris.
Le traitement des données
II a été effectué sur ordinateur grâce à un programme d'analyse
séquentielle des données, Statseq, et à des sous-programmes addi
tionnels, dont l'élaboration est due à P. Bovet, M. Doniot, B. Leroux,
H. Rouanet. i
C. GEORGE 71
RÉSULTATS ET DISCUSSION
Fréquence moyenne de la réponse majoritaire
L'évolution de cette fréquence rapportée dans la figure 2
montre que la nature de l'information apportée par les compteurs
a un effet variable sur l'apprentissage. Notons que le niveau de
performance du groupe contrôle paraît un peu élevé par rapport à
des situations semblables (expérience II ci-après ; George et al.,
1970), bien que le net surajustement (f1 > tzj) observé ici ne
f(r,i
.90-
.70-
.67-
145 A- — 45 A
O 236 O— -23
D 2345 A 14
X 16 •- 26 .50- Contrôle
Fig. 2 (expérience I). — Evolution de la fréquence moyenne de la réponse
majoritaire par blocs successifs de 108 essais. En traits pleins : groupes
recevant une information suffisante pour évaluer la fréquence des réponses
exactes ; en traits pointillés : groupes recevant une information insuffisante
(voir le texte).
puisse surprendre (nombre élevé d'essais ; sujets informés du
caractère aléatoire de la règle de présentation des issues).
On peut en première approximation rendre compte de l'ordre
observé entre les diverses conditions en considérant le caractère
suffisant ou insuffisant de l'information apportée par les diverses 72 HÉMOIRES ORIGINAUX
combinaisons de compteurs pour évaluer la FRE. Cette info
rmation est suffisante seulement dans les groupes 16, 145, 236
et 2345. Les trois premiers groupes ont une performance supé
rieure à celle du groupe contrôle, le dernier une performance
nettement inférieure : il se peut qu'une combinaison triangulaire
comme 236 et 145 suggère plus une sommation des compteurs
latéraux afin de mettre en rapport le total des réponses exactes
et le total des réponses effectuées, qu'une combinaison rectan
gulaire comme 2345. L'ordre observé entre les combinaisons
avec information insuffisante, 26, 14, 45, 23, est peut-être impu
table à la capacité d'estimer l'information qui fait défaut pour
compléter l'information déjà disponible. En effet, si on envisage
l'information complémentaire minimale nécessaire à ces quatre
groupes, il s'agit respectivement du nombre de réponses minor
itaires exactes, du nombre de réponses minoritaires effectuées,
du nombre total de réponses exactes, du nombre total de réponses
effectuées ; or ces quatre nombres se trouvent ordonnés du plus
petit au plus grand. En considérant qu'il est d'autant plus difficile
d'estimer l'information complémentaire nécessaire que celle-ci
se réfère à des valeurs plus élevées, on peut rendre compte de
l'ordre observé dans les quatre conditions avec information
insuffisante par rapport à la FRE.
Le facteur précédent ne permet pas d'interpréter l'ensemble
des résultats, notamment l'infériorité par rapport au groupe
contrôle des groupes 23 et 45 recevant une information FRE
incomplète et celle du groupe 2345 qui est le seul à recevoir
simultanément une information FRE et une PRf
suffisantes. Ce dernier groupe a ignoré la possibilité d'une info
rmation FRE, sans qu'on puisse affirmer qu'il ait fait appel à
l'information PRf. Notons que les groupes comportant au moins
un compteur médian (236, 16, 145, 26, 14) sont supérieurs aux
groupes ne comportant que des compteurs latéraux (2345, 45,
23). Il est possible que les diverses combinaisons de compteurs
interviennent non seulement par le type d'information qu'elles
apportent, mais également par les modes de « lecture »
privilégient. Il est possible également qu'une dissociation
complète de l'information entre les deux types de réponses (2345,
45, 23) freine l'apprentissage en suscitant une tendance à prédire
plus souvent la réponse minoritaire pour équilibrer le contenu
des compteurs de droite et de gauche. C. GEORGE 73
Fréquence conditionnelle des répétitions de la réponse précédente
On a rapporté dans la figure 3 l'évolution par blocs de
108 essais de la fréquence des répétitions de la réponse précédente
selon que celle-ci était une réponse majoritaire correcte (notée
r1+), majoritaire incorrecte (r1_), minoritaire (r2+)
ou minoritaire (r2_). Les résultats des groupes 14,
23 et 2345 ne sont pas rapportés, l'allure générale étant sem
blable à celle du groupe contrôle pour les deux premiers, à celle
du groupe 45 pour le dernier.
On peut noter tout d'abord que tous les groupes ont sens
iblement la même conduite au premier bloc : nette tendance à
répéter une réponse correcte, légère tendance à changer après une
réponse incorrecte, la nature de la réponse précédente (^ ou r2)
ne jouant guère de rôle ; les fréquences de changement après une
réponse incorrecte sont comprises entre 0,51 et 0,65 (puisqu'il
n'y a que deux réponses possibles, la fréquence des changements
est le complément à 1 de la fréquence des répétitions).
Aux blocs 2, 3 et 4 la nature de la réponse précédente joue
un rôle plus marqué puisqu'on observe généralement un écart
croissant entre les deux fréquences de répétition d'une réponse
correcte (l'écart au dernier bloc étant supérieur à celui observé
pour le groupe contrôle dans les groupes 16, 236 et 145, et infé
rieur dans les autres groupes), et un écart croissant entre les
deux fréquences de répétition d'une réponse incorrecte. Les deux
premières courbes demeurent néanmoins supérieures aux
dernières excepté dans les groupes 16, 236 et 145 où la fréquence
des répétitions de rx_ l'emporte sur celle de r2+. La
des de rx_, inférieure à 0,50 au premier bloc dans tous
les groupes, devient aux blocs ultérieurs nettement supérieure à
cette valeur excepté dans les groupes 45 et 2345. On peut noter
que la fréquence des répétitions d'une réponse minoritaire cor
recte demeure supérieure à 0,50 dans tous les groupes même au
dernier bloc.
Cette analyse permet de montrer que l'ordre entre les fr
équences moyennes observé avec la précédente analyse résulte
de conduites différentes de répétition ou de changement, les
groupes qui ont un apprentissage médiocre semblent être soumis
plus longtemps à la conduite initiale observée au premier bloc
dans tous les groupes, et en particulier être plus dépendants de
l'exactitude de leurs réponses que les autres.

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.