Incidence sur l'apprentissage des indices utilisés dans les prédictions avec renforcement aléatoire - article ; n°1 ; vol.70, pg 33-51

De
Publié par

L'année psychologique - Année 1970 - Volume 70 - Numéro 1 - Pages 33-51
Summary
In two probability learning experiments 2x4 groups of students predicted which of two possible events will be presented. In experiment I the sequence of events followed a binomial process, and in experiment II a Markovian one. When the subjects had made a choice, either the last one, two, or three, or no events appeared in the perceptual field (the control group was assumed to be limited only by the immediate memory span). Marked inter-group differences in conditional response frequencies were observed in each experiment. In the first experiment non-conditional response frequency was highest in the group which was exposed to only one event, and lowest in the control group. In the second experiment none of the groups adapted to the Markovian structure of the event sequence; however increasing differences in non-conditional response frequency and non-conditional probability between the 2 events were observed between 2 groups (0,50). These results were interpreted as supporting the hypothesis that the choice of indices utilized in successive decision-making affects learning.
Résumé
Dans deux expériences d'apprentissage de probabilité 2x4 groupes d'étudiants prédisent lequel de deux événements possibles sera présenté. La suite des événements est engendrée par un processus binomial dans l'expérience I, par un processus markovien d'ordre 2 dans l'expérience II. Selon les groupes le premier événement paru subsiste dans le champ perceptif au moment où les sujets font leur choix, ou les deux derniers, ou les trois derniers, ou aucun (ce dernier étant le groupe contrôle, supposé limité seulement par la capacité de sa mémoire immédiate). On observe des différences marquées entre les groupes au niveau des fréquences conditionnelles de réponse dans chaque expérience. Dans l'expérience I, la fréquence non conditionnelle de réponse est la plus élevée dans le groupe auquel on présente un seul événement, la moins élevée dans le groupe contrôle. Dans l'expérience II, aucun groupe ne s'est adapté à la structure markovienne de la série; cependant on observe dans deux groupes des écarts croissants entre la fréquence non conditionnelle de réponse et la probabilité non conditionnelle des deux événements (0,50). Ces résultats sont considérés comme favorables à l'hypothèse que le choix des indices utilisés par les sujets dans leurs décisions successives affecte l'apprentissage.
19 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : jeudi 1 janvier 1970
Lecture(s) : 11
Nombre de pages : 21
Voir plus Voir moins

E. Friemel
Georges Guillain
B. Bedier
Incidence sur l'apprentissage des indices utilisés dans les
prédictions avec renforcement aléatoire
In: L'année psychologique. 1970 vol. 70, n°1. pp. 33-51.
Citer ce document / Cite this document :
Friemel E., Guillain Georges, Bedier B. Incidence sur l'apprentissage des indices utilisés dans les prédictions avec
renforcement aléatoire. In: L'année psychologique. 1970 vol. 70, n°1. pp. 33-51.
doi : 10.3406/psy.1970.27694
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1970_num_70_1_27694Abstract
Summary
In two probability learning experiments 2x4 groups of students predicted which of two possible events
will be presented. In experiment I the sequence of events followed a binomial process, and in
experiment II a Markovian one. When the subjects had made a choice, either the last one, two, or three,
or no events appeared in the perceptual field (the control group was assumed to be limited only by the
immediate memory span). Marked inter-group differences in conditional response frequencies were
observed in each experiment. In the first experiment non-conditional response frequency was highest in
the group which was exposed to only one event, and lowest in the control group. In the second
experiment none of the groups adapted to the Markovian structure of the event sequence; however
increasing differences in non-conditional response frequency and non-conditional probability between
the 2 events were observed between 2 groups (0,50). These results were interpreted as supporting the
hypothesis that the choice of indices utilized in successive decision-making affects learning.
Résumé
Dans deux expériences d'apprentissage de probabilité 2x4 groupes d'étudiants prédisent lequel de
deux événements possibles sera présenté. La suite des événements est engendrée par un processus
binomial dans l'expérience I, par un processus markovien d'ordre 2 dans l'expérience II. Selon les
groupes le premier événement paru subsiste dans le champ perceptif au moment où les sujets font leur
choix, ou les deux derniers, ou les trois derniers, ou aucun (ce dernier étant le groupe contrôle, supposé
limité seulement par la capacité de sa mémoire immédiate). On observe des différences marquées
entre les groupes au niveau des fréquences conditionnelles de réponse dans chaque expérience. Dans
l'expérience I, la fréquence non conditionnelle de réponse est la plus élevée dans le groupe auquel on
présente un seul événement, la moins élevée dans le groupe contrôle. Dans l'expérience II, aucun
groupe ne s'est adapté à la structure markovienne de la série; cependant on observe dans deux
groupes des écarts croissants entre la fréquence non conditionnelle de réponse et la probabilité non
conditionnelle des deux événements (0,50). Ces résultats sont considérés comme favorables à
l'hypothèse que le choix des indices utilisés par les sujets dans leurs décisions successives affecte
l'apprentissage.Laboratoire de Psychologie expérimentale et comparée de la Sorbonne
associé au C.N.R.S.
INCIDENCE SUR L'APPRENTISSAGE
DES INDICES UTILISÉS DANS LES PRÉDICTIONS
AVEC RENFORCEMENT ALÉATOIRE
par C. George, B. Bedier, E. Friemel
SUMMARY
In two probability learning experiments 2x4 groups of students
predicted which of two possible events will be presented. In experiment I
the sequence of events followed a binomial process, and in II
a Markovian one. When the subjects had made a choice, either the last
one, two, or three, or no events appeared in the perceptual field (the contro
group was assumed to be limited only by the immediate memory span).
Marked inter-group differences in conditional response frequencies were
observed in each experiment. In the first experiment non- conditional
response frequency was highest in the group which was exposed to only
one event, and lowest in the control group. In the second experiment none
of the groups adapted to the Markovian structure of the event sequence;
however increasing differences in non- conditional response frequency and
non- conditional probability between the 2 events were observed between
2 groups (0,50). These results were interpreted as supporting the hypothesis
that the choice of indices utilized in successive decision-making affects
learning.
INTRODUCTION
Le paradigme des expériences de choix répertoriées sous la
rubrique apprentissage de probabilité est aujourd'hui bien connu.
Elles prennent usuellement la forme d'expériences de prédiction
simple avec des sujets humains : à chaque essai, après la présen
tation d'un même stimulus qui n'a qu'une fonction de signal
A. PSYCHO!,. 70 2 34 MÉMOIRES ORIGINAUX
préparatoire, le sujet doit prédire lequel de plusieurs événements
possibles surviendra au terme de l'essai ; puis l'un des
se réalise effectivement (une variante consiste à seulement
indiquer au sujet si sa réponse est exacte ou non). En appelant
issue d'un essai la présentation de l'un des événements qui font
l'objet des prédictions (ou plus largement l'opération réalisée
par l'expérimentateur au terme d'un essai), ces expériences
se caractérisent par l'emploi d'une règle aléatoire de présentation
des issues. Le plus souvent on fait appel à deux issues ix et i2,
avec des probabilités respectives 7rx et tc2 = 1 — 7^ indépendantes
du rang de l'essai et de la suite des issues et des réponses anté
rieures (aléa binomial).
Les expériences récentes dans leur grande majorité se détour
nent du problème des raisons du non-emploi de la stratégie pure
pour s'intéresser aux effets séquentiels, c'est-à-dire aux varia
tions de la fréquence des diverses réponses en fonction de la
nature des dernières issues présentées et/ou des dernières réponses
émises. Un des intérêts présentés par l'étude de ces effets est
de rechercher les critères de décision ou indices auxquels recou
rent les sujets. On constate ainsi que les effets séquentiels
dépendent plus des issues antérieures que des réponses antérieures
lorsque l'âge croît (Hake et Hyman, 1953 ; Matalon, 1957 ;
Nicks, 1959 ; Edwards, 1961), et que les sujets utilisent couram
ment comme indices les courtes suites constituées par les 3, 4,
5 dernières issues, voire plus (Nicks, 1959 ; Anderson, 1960).
De nombreuses expériences ont exploré le rôle des files en
appelant ainsi les suites particulières ne comportant que des
issues identiques [run en anglais) (Restle, 1966 ; Rose et Vitz,
1966 ; Gambino et Myers, 1967).
On est ainsi amené à considérer cette situation comme un
apprentissage discriminatif avec renforcement aléatoire (Sum
mers, 1968 ; Halpern et al., 1969). Toutefois l'étude de cette
situation présente des difficultés qu'on ne rencontre pas dans
les apprentissages discriminatifs traditionnels. En particulier
l'expérimentateur ne contrôle pas directement l'ensemble des
indices possibles, puisque au moment où un choix est requis
les événements antérieurs qui servent d'indices sont non pas
présents dans le champ perceptif mais puisés dans l'information
stockée en mémoire à court terme. Et il s'avère que les indices
retenus par les sujets sont, sinon inadéquats, tout au moins
très peu économiques ; ainsi dans les cas où, contrairement aux
expériences évoquées jusqu'ici, la probabilité des issues dépend GEORGE, B. BEDIER, E. FRIEMEL 35 C.
à chaque essai de l'issue précédente (processus markovien
d'ordre 1), les sujets ne restreignent pas leur critère de décision
à la dernière issue, même s'ils ont été prévenus de cette parti
cularité (Engler, 1958 ; Anderson, 1960 ; George, 1969).
On est conduit ainsi à se demander si les indices adoptés par
les sujets n'auraient pas une incidence sur certains aspects de
l'apprentissage. On sait par exemple que l'augmentation du
nombre de caractéristiques non pertinentes retarde la découverte
de la solution dans les expériences d'identification de concepts
(Archer, Bourne et Brown, 1955). Dans les apprentissages de
probabilité on peut noter que lorsque les effets séquentiels sont
absents ou se réduisent à des effets positifs de récence de faible
amplitude, on observe également un surajustement (fréquence
des prédictions de l'issue majoritaire supérieure à la probabilité
de celle-ci) ; tel est le cas avec des enfants d'âge préscolaire
(Derks et Paclinasu, 1967 ; Bogartz, 1965) ou avec des adultes
après un long exercice (Edwards, 1961 ; Derks, 1962). Ces obser
vations auxquelles on peut en ajouter d'autres nous ont conduit
à supposer que l'apprentissage est d'autant plus efficace que
l'ensemble des indices utilisés est plus adéquat à la structure
séquentielle de la série des issues déterminée par la règle de
présentation et est plus économique (George, 1969).
Plus spécifiquement, nous ferons ici l'hypothèse que l'eff
icacité de l'apprentissage dépend du nombre d'issues antécédentes
qui interviennent dans les critères de décision des sujets. Ce
nombre n'égale pas nécessairement le nombre d'issues antécé
dentes englobées dans le champ d'appréhension de la mémoire
immédiate, comme en témoigne une recherche récente de Vitz
et Hazan (1969) dans laquelle les sujets peuvent rappeler en
moyenne les 14 dernières issues présentées avec une probabilité
des rappels exacts supérieure à celle attendue par la chance
seule (la tâche de prédiction était interrompue à trois reprises
non attendues pour procéder à un rappel sériai). Pour tester
cette hypothèse on a tenté d'imposer aux sujets des deux expé
riences relatées ci-après le recours à un nombre défini d'issues
antécédentes comme critère de décision. Pour cela, dans les
groupes expérimentaux G^ G2, C3, on a utilisé un dispositif qui
laisse à chaque essai présent dans le champ de perception
visuelle des sujets respectivement la dernière, les deux dernières
ou les trois dernières issues ; en outre, on a demandé aux sujets
de répondre en tenant compte des issues ou de l'issue ainsi
privilégiées, le but étant de réaliser une sorte de « diaphragmage » 36 MÉMOIRES ORIGINAUX
des indices utilisés. Un groupe contrôle Co opère sans qu'aucune
issue antécédente soit présente perceptivement au moment des
choix et sans recommandation particulière quant au(x) indice(s)
à utiliser.
Deux expériences ont été réalisées, qui ne diffèrent que par
le processus aléatoire retenu pour la règle de présentation des
issues : aléa binomial (processus markovien d'ordre 0) dans
la première, processus markovien d'ordre 2 dans la seconde.
Ainsi dans le premier cas la probabilité des deux issues possibles
demeure invariante d'essai en essai et est en particulier indé
pendante des issues précédentes, tandis que dans le second
cas elle dépend des deux dernières issues. En considérant que
la multiplication des indices utilisés entrave l'apprentissage,
on devrait observer dans l'expérience I, par ordre de supérior
ité décroissante, Gj > G2 > C3 > Co ; et dans l'expérience II,
C2 > C3 > Go > C1( l'apprentissage devant être meilleur ici
en G2 où le nombre de deux issues antécédentes correspond
exactement à l'ordre 2 du processus markovien, tandis qu'aucun
apprentissage ne serait possible en Cx. (On considère en effectuant
ces prédictions que dans les deux expériences les sujets du
groupe contrôle font appel au moins aux trois dernières issues.)
Puisqu'on stipule aux sujets que leur tâche consiste à obtenir
le plus possible de réponses exactes, on retiendra comme indi
cateur de réussite la variable qui caractérise la stratégie optimale,
à savoir la fréquence moyenne (marginale) de réponse dans
l'expérience I, et la fréquence de réponse conditionnelle sur
les deux dernières issues dans l'expérience II. Notons enfin
que l'ordre de supériorité des groupes a été inféré sous condition
que la procédure de « diaphragmage » soit efficace.
MÉTHODE
A) Expérience I
1) Matériel
Une série de chiffres 1 et de 2 a été inscrite sur une bande de
papier, les sujets devant prédire à chaque essai le chiffre suivant.
Cette bande défile horizontalement et de droite à gauche derrière
la fenêtre d'un grand écran. Deux volets permettent de régler
l'ouverture de la fenêtre de façon que 0, 1, 2 ou 3 chiffres soient
visibles simultanément. C. GEORGE, B. BEDIER, E. FRIEMEL 37
Les sujets effectuent leurs prédictions en appuyant sur une
clé de réponse placée devant eux, une fois pour le chiffre 1 et
deux fois sur le chiffre 2.
2) Procédure
Le début de chaque essai est marqué par un top sonore.
Chaque essai d'une durée de 6 secondes est subdivisé en deux
phases de 3 secondes chacune, une phase de réponse et une
phase de lecture. Le passage de la première à la seconde phase
correspond à un déplacement rapide de la bande de sorte que
le chiffre que les sujets devaient prédire au début de l'essai
devient visible à droite de la fenêtre, constituant l'issue de
l'essai en cours.
Dans la condition contrôle Go, aucun chiffre n'est visible
pendant la phase de réponse, et l'issue de l'essai en cours est
présentée pendant la phase de lecture.
Dans la condition C^, seule l'issue de l'essai antérieur est
visible pendant la phase de réponse ; puis le déplacement de
la bande rend visible l'issue de l'essai en cours en masquant le
chiffre précédent.
Dans la condition G2, les issues des essais n — 2 et n — 1
sont visibles simultanément pendant la phase de réponse de
l'essai n ; puis pendant la phase de lecture, les issues des
essais n — 1 et n.
Dans la condition G3, les sujets perçoivent pendant la phase
de lecture les issues des 3 essais précédents.
3) Consignes
Les consignes furent identiques pour tous les sujets à cer
taines variantes près relatives aux modalités propres à chaque
condition expérimentale. Après les explications préliminaires
sur la tâche, on poursuivait :
« Voici maintenant une information très importante. La
suite des chiffres a été obtenue par des tirages au sort successifs
dans des urnes comportant des jetons marqués 1 ou 2. Après
avoir extrait un jeton, on le remettait dans l'urne dont on
brassait soigneusement le contenu avant de procéder à un
nouveau tirage.
« La même procédure de tirage a été utilisée pour constituer
la série complète. En particulier, la proportion des deux types
de jetons dans chaque urne est demeurée invariante. 38 MÉMOIRES ORIGINAUX
« En procédant ainsi, il est impossible de prévoir avec
certitude quel chiffre sera extrait. Il n'y a absolument aucune
périodicité, aucune régularité prédéterminée dans la série des
chiffres que vous allez voir. Il est donc impossible de faire une
prédiction exacte à tous les essais.
« Bien qu'il soit impossible de faire une prédiction exacte à
chaque essai, la série a des propriétés qui peuvent vous permettre
d'obtenir plus de 50 % de réponses exactes. »
Puis le paragraphe suivant était lu aux sujets des trois
conditions expérimentales C^ C2, C3 :
« Afin de vous permettre de découvrir certaines de ces
propriétés, le(s) (deux, trois) dernier(s) chifîre(s) présenté(s)
sera (seront) toujours visible(s) dans la fenêtre. Il(s) vous per
mettra (permettront) d'acquérir une information qui peut vous
être utile pour faire vos prédictions.
« Nous vous demandons de répondre en tenant compte du
(des) chiffre(s) présent(s) dans la fenêtre. »
Enfin le dernier paragraphe était commun à toutes les
conditions : « Nous vous rappelons qu'il faut répondre immé
diatement après chaque top, avant la présentation du nouveau
chiffre. Il est indispensable que vous fassiez une prédiction à
tous les essais : sinon vos résultats seront inutilisables. Si vous
ne savez pas quel chiffre prédire, vous pariez pour l'un des deux.
« Votre tâche consiste à faire, sur l'ensemble de la série,
le plus grand nombre possible de prédictions exactes.
« Bon, nous allons commencer. Dès le premier top, indiquez
votre prédiction, et ainsi de suite pour chaque top. »
4) Mode de constitution de la série des issues
Une série unique étant présentée à tous les sujets de l'expé
rience I, nous avons voulu qu'elle soit aussi « représentative »
que possible d'un processus binomial en affectant la probab
ilité 7Ci = 2/3 au chiffre 1 et la probabilité 7t2 = 1/3 au chiffre 2.
Initialement on a constitué 12 blocs de 108 chiffres chacun,
les tirages étant effectués dans des urnes en contrôlant les
probabilités moyennes et les probabilités de transition d'ordre 1
et d'ordre 2. En outre, on a calculé sur 432 tirages l'espérance
mathématique du nombre de files (en appelant file une suite
d'événements identiques non interrompue par un événement
distinct) comportant 1, 2, 3, . . . , k chiffres 1 ou chiffres 2. On
a alors choisi parmi l'ensemble initial de 12 blocs 4 blocs pour C. GEORGE, B. BEDIER, E. FRIEMEL 39
lesquels la distribution observée de la fréquence des diverses
files constituait l'approximation la plus satisfaisante de la
répartition calculée.
Enfin, cette série de 432 chiffres a été précédée sur la bande
où ils ont été transcrits par trois chiffres, 1, 1,2, qui sont utilisés
pour familiariser les sujets avec la tâche au début des consignes.
5) Plan d'expérience
II comporte 4 groupes indépendants de 10 sujets, chaque
groupe opérant dans une seule des conditions Go, Cx, C2 ou G3.
L'expérience est collective dans chaque condition.
6) Sujets
Ceux-ci sont quarante étudiants en première année du
premier cycle de psychologie, tous volontaires, répartis selon
leur convenance de jour et d'horaire en quatre groupes indé
pendants.
7) Le traitement des données
II a été effectué sur ordinateur grâce à un programme d'ana
lyse séquentielle des données élaboré par Doniot et H. Rouanet,
et à des sous-programmes additionnels dus à P. Bovet.
B) Expérience II
Elle ne diffère de l'expérience I que par l'emploi d'une autre
règle aléatoire pour engendrer la série des issues, un processus
markovien d'ordre 2. La matrice de transition a été choisie de
façon que les mêmes valeurs 2/3 et 1/3 soient utilisées et que la
stratégie optimale procure le même nombre de gains que préc
édemment. Les chiffres 1 et 2 sont équiprobables au niveau des
probabilités moyennes et des probabilités de transition d'ordre 1.
Par contre le chiffre 1 a une probabilité de 2/3 après les couples 1 1
et 22, de 1/3 après les couples 12 et 21 (et complémentairement,
1/3 et 2/3 pour le chiffre 2 après ces mêmes suites).
L'unique série de 432 issues utilisée dans l'expérience II a
été constituée en observant des règles analogues à celles ment
ionnées pour l'expérience I.
Notons que la répartition des valeurs de probabilités dans
cette matrice engendre une dissymétrie entre la répartition des
files 1 et celle des files de 2. En effet la probabilité du chiffre 1 40 MÉMOIRES ORIGINAUX
est égale à 1/3 après un seul chiffre 1 (c'est-à-dire après la
suite 21) et à 2/3 deux chiffres 1 ou plus (après les suites 21 1 ,
2111...) ; par contre la probabilité du chiffre 2 est égale à 2/3
après un seul chiffre 2 (après la suite 12) et à 1/3 après 2 chiffres 2
ou plus (122, 1222...). Il en résulte que les longues files sont
plus fréquentes pour 1 que pour 2, tandis que les files comportant
exactement deux issues identiques (1221 ou 2112) sont plus
fréquentes pour 2 que pour 1.
Quarante nouveaux sujets, recrutés dans les mêmes condi
tions que ceux de l'expérience I, ont été répartis en 4 groupes
égaux et indépendants.
RÉSULTATS
A) Expérience I
1) Fréquence moyenne de réponse
La fréquence moyenne des réponses 1 est supérieure à 7rx,
probabilité d'apparition de l'issue 1 dès le bloc 3 dans tous les
Fig. 1. — par Evolution blocs successifs de la fréquence de 108 essais moyenne (expérience de la réponse I) rt
groupes. Ce surajustement est significatif au bloc 3 pour Cx
et C2, et au bloc 4 pour Cx (l de Student, S. à 0,02). Les quatre
groupes se différencient surtout aux blocs 3 et 4, où le groupe
contrôle a le niveau de performance le plus faible, Cx le niveau

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.