L'effet de la récompense différée sur l'apprentissage - article ; n°1 ; vol.34, pg 114-158

De
Publié par

L'année psychologique - Année 1933 - Volume 34 - Numéro 1 - Pages 114-158
45 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : dimanche 1 janvier 1933
Lecture(s) : 15
Nombre de pages : 46
Voir plus Voir moins

A. Zaganczyk
VI. L'effet de la récompense différée sur l'apprentissage
In: L'année psychologique. 1933 vol. 34, n°1. pp. 114-158.
Citer ce document / Cite this document :
Zaganczyk A. VI. L'effet de la récompense différée sur l'apprentissage. In: L'année psychologique. 1933 vol. 34, n°1. pp. 114-
158.
doi : 10.3406/psy.1933.29868
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1933_num_34_1_29868du laboratoire de Psychologie pédagogique Travail
de T Université de Louvain
Directeur : Pr A. Fauville
VI
L'EFFET DE LA RÉCOMPENSE DIFFÉRÉE
SUR L'APPRENTISSAGE
Par A. Zaganczyk
SOMMAIRE
Pages
I. La loi de l'effet suivant la conception de Thorndike. . . 114
II. L'apprentissage des lignes 119
III. L'association des chiffres a des mots 142
IV. Recherches faites par d'autres auteurs 150
V. Discussions et conclusions 156
I. — LA LOI DE L'EFFET
SUIVANT LA CONCEPTION DE THORNDIKE
Thorndike, faisant, au cours de ces dernières années, dans le
domaine de l'apprentissage, des expériences très étendues et
précises1, a remarqué que, contrairement à ce qu'on pensait,
la simple répétition d'une activité ne produit pas l'apprent
issage.
Il a étudié particulièrement un facteur qu'il croit très
puissant et qu'il décrit sous le nom de la loi de l'effet : lorsqu'une
connexion entre une situation et une réponse est établie et
suivie d'une satisfaction, elle est par ce fait renforcée et quand
1. Thorndike, E. L., Human Learning. New York, Teachers College,
Columbia University, 1931. E. L., The fundamentals of Learning, New York, Teachers
College, Columbia University, 1932. ZAGANGZYK. — LA RÉCOMPENSE DIFFÉRÉE 115 A.
la même connexion est suivie d'un état désagréable, d'un
effet malheureux, sa force est affaiblie.
Par satisfaction il entend un état où le sujet ne fait rien
pour le changer, au contraire, est capable de faire beaucoup
de choses pour le maintenir. Un état désagréable est jugé tel
lorsque le sujet fait des essais multiples de s'en débarrasser.
Bien que la loi de l'effet n'ait jamais été énoncée aussi
explicitement, elle était à notre avis reconnue implicitement
depuis toujours dans la vie courante comme à l'école par
l'emploi de récompenses et de punitions, malheureusement
beaucoup plus de punitions que de récompenses ; et aussi par
la distinction faite par nous-mêmes et par les autres de nos
actions en bonnes et mauvaises. Mais ces applications n'avaient
pas la base scientifique que leur donne Thorndike.
Pour lui les résultats d'une connexion n'agissent pas sur
elle d'une manière mystérieuse et magique. Ge n'est pas le
mot « mal » ou « bien » qui aurait en lui-même un pouvoir
incompréhensible. Ce n'est pas la réussite de l'action qui a de
l'importance pour l'apprentissage, mais le plaisir qui résulte
d'une activité, le contentement d'atteindre la fin désirée, la
satisfaction résultant de l'approbation d'autrui, le méconten
tement en cas d'échec ou la peine provoquée par certains
actes.
Certains auteurs comme Hollingworth1 voudraient rem
placer le terme effet par celui d'« affection » de plaisir senti.
Peut-être n'ont-ils pas tort.
La satisfaction varie d'importance suivant la valeur que
nous attachons au but à atteindre. Si, par exemple, nous
tenons beaucoup à l'estime des autres, un « bien » prononcé
par quelqu'un produit un plus grand effet que sur la personne
qui y tient moins. Si nous désirons ardemment apprendre
quelque chose, nous rendons plus intense l'action de l'effet.
Cela explique le grand rôle de l'intérêt dans tout apprent
issage.
La loi de l'effet établie, Thorndike fait des recherches
étendues pour déterminer son intensité et son mode d'action.
Thorndike résume ses recherches dans ces quelques phrases
qui montrent l'importance du rôle de l'effet2.
1. H. L. Hollingworth, Effect and affect in Learning. Psych. Rev.,
1931, 38, 153.
2. Human Learning, 28-29. MÉMOIRES ORIGINAUX 116
La fréquence, la pure répétition d'une connexion ne cause
pas l'apprentissage, elle peut être une condition nécessaire
pour que les autres facteurs agissent, mais elle n'est pas une
cause productrice.
La répétition d'une connexion où les deux termes s'appar
tiennent d'une manière quelconque peut produire un renfo
rcement mais le progrès est plutôt lent et très faible.
L'effet apparaît pour ainsi dire comme une cause unique,
comme un facteur du premier ordre dans tout apprentis
sage.
Il a démontré aussi d'une manière quantitative, au moyen
de ses expériences, que l'effet heureux renforce beaucoup plus la
connexion que ne l'affaiblit l'effet malheureux. En ces derniers
temps, il est même arrivé à dire que le désagrément ne diminue
pas la force de la connexion, mais qu'il crée un lien nouveau
ou même renforce légèrement la connexion mauvaise. Les
effets de la récompense ne sont donc nullement comparables à
ceux de la punition. La récompense seule devrait être conseillée
comme moyen efficace dans l'éducation. Entre effet heureux
et malheureux il y a encore une autre différence et plus pro
fonde parce que concernant non plus l'intensité de leur action
mais leur mode d'agir. L'effet heureux seul exerce une
immédiate sur la connexion établie entre la situation et la
réponse, renforce cette directement dans le système
nerveux. Et ceci constitue la partie la plus importante et la
plus intéressante peut-être de toute la théorie de Thorndike,
mais en même temps la partie la plus difficile à admettre et
la plus discutée.
Dire que l'effet agit d'une manière directe, c'est accepter
par avance la possibilité action rétroactive sur le sys
tème nerveux. Une situation se présente, nous donnons la
réponse, après quoi seulement nous pouvons être satisfaits et
cependant cet état agréable renforce directement la connexion
que nous avons établie antérieurement. Cette action rétroactive
est certainement une conception originale mais qui rencontre
bien des oppositions.
La réfutation de la thèse de Thorndike n'est pas aisée, car
l'auteur ne se contente pas simplement d'affirmations, mais
il en donne des preuves nombreuses, des arguments d'ordre
logique et surtout d'ordre expérimental.
Nous ne pouvons exposer toutes ces expériences dont la
plupart sont bien connues. Nous voudrions seulement attirer ZAGANCZYK. — LA RÉCOMPENSE DIFFÉRÉE 117 A.
l'attention sur son dernier travail1 : l'étude expérimentale de
la récompense, qui nous paraît de très haute valeur comme
preuve de l'action directe de l'effet.
Voici le principe des expériences :
On présente au sujet une longue série de situations ; à
chacune d'elles plusieurs réponses sont possibles ; arbitra
irement une seule est récompensée par un bien ; . les autres
étant punies par un mal. Le sujet doit apprendre à trouver la
bonne réponse parmi toutes les autres.
Par exemple, l'expérimentateur lit une série de mots, le
sujet répond à chacun d'eux par un chiffre de 1 à 10.
Supposons :
mur - 9 (mal)
table - 4
chambre - 6 (mal)
effort - 5 (mal)
plume - 2 (bien )
pensée - 7 (mal)
tableau - 3
jardin - 3 (mal)
chien - 2
notion - 8 (mal)
Lorsque pour « plume » le sujet donne la réponse - 2 il est
approuvé, toutes les autres réponses sont jugées mauvaises.
Or, on constate que dans l'essai suivant non seulement la
connexion récompensée a plus de chance de réapparaître,
mais qu'aussi les connexions mauvaises : effort - 5, pensée - 7,
bien que punies comme les autres tendent à revenir plus fr
équemment. L'effet de la satisfaction ne se limite pas à la
connexion à laquelle elle appartient, elle rayonne autour
d'elle, en renforçant les connexions voisines quoique avec une
force moindre.
Le voisinage, plus ou moins proche, de la connexion heu
reuse peut s'exprimer en nombre de pas ou de connexions.
« Effort 5 », par exemple, est éloigné de la bonne réponse d'un
pas, tandis que « mur - 9 » est distant de 5 pas. Comme le
progrès se traduit habituellement en pour cent de répétitions
de la réponse donnée, nous pouvons déterminer le renfo
rcement d'un lien dû au voisinage de la récompense en prenant
son pourcentage et en le comparant à celui d'une connexion
1. Thorndike, E. L., An experimental Study of Rewards. New York,
Teachers College, Columbia University, 1933. MÉMOIRES ORIGINAUX 118
assez éloignée pour que cette influence ne soit plus ressentie.
Prenons un exemple. Les résultats d'une des expériences
de Thorndike montrent que la réponse jugée bonne réapparaît
dans 50 % des cas, la réponse voisine punie revient encore 16,5 %, celle éloignée de 2 pas — 13,5 %, et celle qui est
encore plus distante — 11 %.
Comme le sujet doit choisir entre 10 réponses, le seul hasard
pourrait expliquer une réapparition dans 10 % des cas, il
reste donc 1 % à attribuer à la punition, 40 % à la récom
pense, 5,5 % à son voisinage proche, et 2,5 % à son voisinage
plus éloigné.
15 différentes expériences ont été réalisées suivant le
même principe.
Voici les résultats d'ensemble1 :
La colonne I donne en pour cent les différences dans le
renforcement des connexions voisines de la récompense par
rapport à celles qui sont éloignées d'elle de 2 pas et plus.
La colonne II donne les mêmes différences en comparant les
connexions éloignées d'un pas et de 2 pas à celles éloignées
de 3 pas et plus.
n (1), n (2 ou plus), n (1 + 2), n (3 ou plus) : nombre de
connexions inclues dans le compte.
Expériences I n (1) n (2 ou plus) II n (1 + 2) n (3 ou plus)
2.411 A 6,7 2.413 7,3 3.658 1.166
B 0,9 1.863 0,2 2.766 2.260 1.357
1.3552 521 C 2,0
D -0,7 1.480 2.167 0,5 2.304 1.343
E 8,6 311 309 15,8 456 164
3.053 F 2,1 3.700 2,7 4.644 2.109
G 1,6 465 631 2,8 753 343
4.136 Ha Hl 4,5 5.411 4,7 6.386 3.161
Hb 0,7 1.024 1.597 3,6 1.596 1.025
Hc 1.147 2,5 1.556 2,6 1.723 980
7.774 I 2,4 14.592 2,8 12.799 9.837
J 2.085 3,7 8.509 2,5 3.718 6.873
2.263 K 0,8 3.566 0,9 3.692 2.137
L 0,9 809 -0,1 1.465 2.361 3.017
M 1.088 4,7 1.988 4,9 1.762 1.314
Or, remarque Thorndike, le renforcement d'une connexion
récompensée peut être compliqué par les répétitions internes
1. Thorndike, E. L., An experimental Study of Rewards, 48.
2. Dans l'expérience C les connexions punies qui se trouvaient entre
2 bonnes réponses sont incluses. ZAGANCZYK. LA RÉCOMPENSE DIFFÉRÉE 119 A.
du lien formé ou quelque chose d'équivalent et plus tard par
l'attente de la récompense, mais le renforcement d'une
connexion voisine est libre de pareilles complications, car
toutes les tentatives conscientes que nous pouvons supposer
chez le sujet auront pour but d'affaiblir la mauvaise connexion.
La satisfaction donc, dit-il, peut agir directement sans que
nous nous en rendions compte, comme la lumière du soleil
agit sur les plantes, comme un courant électrique modifie le
courant voisin ou la terre attire la lune. Il est aussi
très important de souligner que l'influence d'une satisfaction
sur les autres connexions se répand aussi bien dans les deux
sens, c'est-à-dire, qu'elle renforce les connexions qui la pré
cèdent comme celles qui la suivent. Cela montre que la possi
bilité d'un renforcement rétroactif n'est pas purement
imaginaire.
II. — L'APPRENTISSAGE DES LIGNES
Partant de la conception de l'effet émise par E. L. Thorn-
dike et désirant étudier son caractère rétroactif, nous nous
sommes demandé ce qui résulterait d'un retard dans l'action
de. l'effet. Que résulterait-il d'un intervalle séparant une
activité de son effet heureux ou malheureux — cet intervalle
pouvant être un temps de repos et d'attente ou être occupé
par un mouvement ou un travail mental plus ou moins
difficile ?
Pour répondre à ces questions nous avons utilisé en premier
lieu une technique imaginée par Thorndike : apprendre aux
sujets à tracer, les yeux bandés, des lignes de 9, 12, 15 et 18 cm.
Chaque sujet exécute une double série d'expériences : les unes
où l'effet agit immédiatement, c'est-à-dire où l'expérimentateur
dit « bien » ou « mal » dès que la ligne est tracée ; les autres
où l'effet agit après un intervalle. Les expériences à effet
immédiat ont été faites avec les lignes de 12 et 18 cm. ; les
expériences à effet différé avec les de 9 et 15 cm. Pour
que la ligne fût toujours tracée au même endroit et dans la
même direction, on avait placé sur la table à 30 cm. du bord
un té de dessinateur sous lequel on glissait une feuille de
papier. Le sujet mettait le crayon à l'angle du té et traçait la
ligne d'un mouvement brusque en suivant la longue branche.
La ligne de 12 cm. était jugée correcte quand elle avait une .
120 MÉMOIRES ORIGINAUX
longueur comprise entre 11,3 cm. et 12,7 cm., ces 2 longueurs
étant indiquées par 2 lignes parallèles tracées sur le papier.
Pour la ligne de 18 cm. les lignes étaient 17,3 et 18,7 cm. Pour
la ligne de 9 cm. les limites étaient 8,6 et 9,4 cm. Pour la ligne
de 15 cm. les limites étaient 14,3 et 15,7 cm.
Premier groupe d'expériences. — Quatre sujets firent ces
expériences. Chaque expérience dura 9 jours. Le premier jour,
un test, donc pas d'appréciation de l'expérimentateur ; les
7 jours suivants exercice avec appréciation « bien » ou « mal » ;
le 9e jour un second test sans appréciation. Dans la mesure du
possible, on fit les expériences chaque jour à la même heure.
Chaque jour le sujet trace 150 lignes de chaque longueur. Un
jour, on commence par 300 lignes à effet immédiat et, après un
repos, on fait 300 lignes à effet différé. Le jour suivant ce sont
les lignes à effet différé qui viennent en premier lieu. Dans
chaque série de 300 lignes les 2 longueurs sont mélangées, longueur est donnée en groupes de 4, 5, 6, 7 ou 8 unités,
la succession de ces différents étant déterminée par
le hasard 'et chaque groupe de lignes d'une longueur étant
suivi d'un groupe d'autres lignes.
Ainsi on évite, d'une part, le changement continuel d'une
longueur à l'autre, ce qui serait trop énervant et difficile ; et,
d'autre part, une répétition prolongée de la même longueur qui
produirait plutôt la mécanisation d'un geste, que l'appren
tissage d'une longueur déterminée.
Le même ordre est suivi pour 9 et 15 cm. et pour 12 et
18 cm. Voici le commencement de cette répartition :
9 cm. 12 cm
9 — 12 —
9 — 12 —
9 — 12 —
15 — 18 —
15 — 18 —
15 — 18 —
15 — 18 —
15 — 18 —
15 — 18 —
9 — 12 —
9 — 12 —
9 — 12 —
9 12 —
La différence entre l'effet immédiat et l'effet différé
consistait en ce que dans ce dernier le sujet après avoir tracé
la ligne ramenait tout de suite le crayon au point de départ A. ZAGANCZYK. — LA RÉCOMPENSE DIFFÉRÉE 121
et alors seulement recevait l'appréciation de l'expériment
ateur. Dans l'effet immédiat, le sujet s'arrêtait après avoir
trace la ligne, l'expérimentateur disait « bien » ou « mal » et le
sujet revenait au point de départ.
Remarque. — La technique que nous venons de décrire
fut appliquée seulement à partir du second sujet. Pour le
premier, on se servait, au lieu d'un té, simplement d'une règle
fixée au bord de la table qui servait de point de départ.
Après chaque mouvement le sujet devait descendre la
main un peu plus bas, mais les yeux étant fermés, les lignes
étaient obliques au lieu d'être droites, elles se croisaient, se
superposaient, ce qui rendait les mesures et les calculs trop
pénibles. Outre cette raison d'ordre pratique, il y avait
encore celle-ci : le sujet, chaque fois, devait changer la
position du bras et par conséquent il ne se trouvait pas tou
jours dans la même situation. C'est pour ces motifs que nous
avons préféré employer le té.
La répartition des séries des excitants était aussi autre
pour ce premier sujet. Nous avions mélangé les groupes de
9 cm. et de 15 cm. et ensuite tiré au sort; le hasard a ainsi
présenté des cas de plusieurs groupes de la même longueur qui
se suivaient. Pour éviter cette répétition prolongée du même
excitant nous avons adopté la répartition indiquée plus haut.
Nous avons calculé pour chaque jour les pourcentages de
bonnes réponses, les moyennes arithmétiques et les variations
types des longueurs des lignes tracées. Dans l'analyse des
résultats nous considérions surtout les 2 tests et le premier et
le dernier jour d'exercice.
Premier groupe d'expériences. — Premier sujet
L'effet immédiat
1er ex. 2« ex. 3e ex. 4° ex. 5e ex. 6e ex. 7e ex. Test Test
18 cm.
12,48 12,17 17,31 19,23 19,75 19,11 18,66 19,09 M ... 20,37
2,4 1,80 2,54 2,44 o .. . . 2,73 2,04 1,65 2,12 2,33
0/ 6,6 6,6 42,6 38,00 29,3 28,0 42,0 23,3 9,3 /o ■• •
12 cm.
8,46 12,79 13,05 12,61 12,28 12,37 12,03 12,89 M ... 9,23
o. . . . 1,72 1,91 1,39 1,36 1,26 1,61 1,13 1,18 1,64
0/ 9,3 6,0 54,0 46,0 55,3 37,3 42,6 473 37,3 /o •• • MEMOIRES ORIGINAUX 122
L'effet différé
2e ex. 3e ex. 4e ex. 5° ex. 6e ex. 7e ex. 1er ex. Test Test
15 cm.
M . .. 12,25 10,03 14.37 17,48 15,46 15,98 15,65 14,21 13,73
2,25 1,70 3,05 1,89 2,04 1,91 1,37 a .... 1,68 2,12
30,0 36,0 0/ /o • • • 20,6 1,3 29,3 16,6 38,0 30,0 23,3
9 cm.
9,69 M ... 9,05 7,59 9,56 11,38 9,8 11,43 10,72 8,67
1,31 1,82 1,17 2,42 2,23 1,06 0,89 CT.. . . 1,68 1,27
o/ 17,0 18,0 38,0 /o • • • 22,6 13,3 11,3 10,0 36,0 30,6
Second sujet
L'effet immédiat
1er ex. 2e ex. 3e ex. 4e ex. 5e ex. 6e ex. 7 e ex. Test Test
18 cm.
18,14 17,05 17,84 18,86 18,33 20,78 M ... 19,41 18,19 17,96
a .. . . 2,19 3,38 1,76 2,63 1,76 1,88 1,61 1,40 2,08
0/ /o •• ■ 31,3 29,3 34,0 23,3 28,0 29,3 47,3 46,0 10,0
12 cm.
12,89 11,83 12,15 11,54 11,86 12,43 12,09 13,39 M ... 12,56
1,41 0,94 1,11 a .. . . 2,15 2,68 1,04 0,81 1,02 1,37
0/ /o •• • 32,0 34,0 52,0 51,3 60,0 61,3 59,3 64,0 30,6
L'effet différé
1er ex. 2e ex. 3e ex. 4e ex. 5e ex. 6e ex. 7e ex. Test Test
15 cm.
M ... 11,69 14,83 14,31 13,78 14,23 14,28 14,87 15,37 15,40
a .... 1,94 1,61 1,8 1,61 1,34 1,27 1,48 1,53 1,57
32,6 %•■• 3,3 34,6 18,0 42,6 38,6 43,3 53,3 38,0
9 cm.
8,57 M ... 9,04 8,88 8,90 9,07 9,17 9,25 9,06 9,75
a . . . . 1,56 1,0 0,95 0,93 0,83 0,85 0,93 0,71 0,88
%••• 20,0 43,3 52,6 37,3 47,3 40,6 42,0 60,0 30,0
Troisième sujet
L'effet immédiat
1er ex. 2e ex. 3e ex. 4e ex. 5e ex. 6e ex. 7e ex. Test Test
18 cm.
M ... 19,55 17,33 18,45 18,39 18,52 17,73 17,86 17,48 16,95
a .. . . 1,55 1,93 1,63 1,60 1.59 1,25 1,32 1,63 1,50
/o • • • 26,6 32,6 44,6 40,0 38,0 42,0 48,6 46,6 28,0
12 cm.
M ... 14,22 12,18 12,32 12,55 12,67 11,92 12,11 11,80 11,11
a .. . . 1,32 1,29 1,02 1,57 0,97 1,09 1,06 1,18 0,91
0/ /o •• • 12,3 50,6 51,3 49,3 62,0 52,6 53,6 52,6 38,6

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.