Sur un paradoxe dans l'estimation du temps chez l'animal - article ; n°1 ; vol.78, pg 163-181

De
Publié par

L'année psychologique - Année 1978 - Volume 78 - Numéro 1 - Pages 163-181
Summary
The paper discusses data relevant to the fixed-interval (FI)-differential-reinforcement-oj-low-rates (DRL) paradox in the domain of temporal regulation of animal behavior. Point 1 suggests that biological constraints per se do not seem to explain the FI-DRL paradox. Point 2 suggests that regular structure or reinforcement periodicity in the FI situation acts as an external synchroniser for operant activity. Point 3 integrates schedule structure, inhibitory control of operant behavior and biological constraints in a possible explanation of the FI-DRL discrepancies. Future experimental developments are suggested.
Résumé
Le texte discute le paradoxe qui existe entre les performances dans les programmes opérants à intervalle fixe (FI) et de débit de réponses lent (DRL) chez une même espèce animale. Après une analyse d'hypothèses ou contraintes biologiques au sens large (point 1) et une définition du rôle de la régularité ou périodicité de l'événement renforçant dans le programme FI (point 2), il est suggéré que cette périodicité associée au contrôle inhibiteur de l'opérant et en relation avec les contraintes biologiques puisse sous-tendre le paradoxe FI-DRL (point 3).
19 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : dimanche 1 janvier 1978
Lecture(s) : 15
Nombre de pages : 20
Voir plus Voir moins

Helga Lejeune
Sur un paradoxe dans l'estimation du temps chez l'animal
In: L'année psychologique. 1978 vol. 78, n°1. pp. 163-181.
Abstract
Summary
The paper discusses data relevant to the fixed-interval (FI)-differential-reinforcement-oj-low-rates (DRL) paradox in the domain of
temporal regulation of animal behavior. Point 1 suggests that biological constraints per se do not seem to explain the FI-DRL
paradox. Point 2 suggests that regular structure or reinforcement periodicity in the FI situation acts as an external synchroniser
for operant activity. Point 3 integrates schedule structure, inhibitory control of operant behavior and biological constraints in a
possible explanation of the FI-DRL discrepancies. Future experimental developments are suggested.
Résumé
Le texte discute le paradoxe qui existe entre les performances dans les programmes opérants à intervalle fixe (FI) et de débit de
réponses lent (DRL) chez une même espèce animale. Après une analyse d'hypothèses ou contraintes biologiques au sens large
(point 1) et une définition du rôle de la régularité ou périodicité de l'événement renforçant dans le programme FI (point 2), il est
suggéré que cette périodicité associée au contrôle inhibiteur de l'opérant et en relation avec les contraintes biologiques puisse
sous-tendre le paradoxe FI-DRL (point 3).
Citer ce document / Cite this document :
Lejeune Helga. Sur un paradoxe dans l'estimation du temps chez l'animal. In: L'année psychologique. 1978 vol. 78, n°1. pp.
163-181.
doi : 10.3406/psy.1978.28236
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1978_num_78_1_28236L'Année Psychologique, 1978, 78, 163-181
REVUES CRITIQUES
SUR UN PARADOXE
DANS L'ESTIMATION DU TEMPS CHEZ L'ANIMAL
par Helga Lejeune1
Université de Liège
Laboratoire de Psychologie expérimentale2
SUMMARY
The paper discusses data relevant to the fixed-interval ( FI )-differential-
reinforcement-oj-low-rates (DRL) paradox in the domain of temporal
regulation of animal behavior. Point 1 suggests that biological constraints
per se do not seem to explain the FI-DRL paradox. Point 2 suggests that
regular structure or reinforcement periodicity in the FI situation acts as
an external synchroniser for opérant activity. Point 3 integrates schedule
structure, inhibitory control of behavior and biological constraints
in a possible explanation of the FI-DRL discrepancies. Future experi
mental developments are suggested.
Parmi les moyens d'étude des régulations temporelles acquises chez
l'animal, il faut relever deux programmes opérants classiques, l'inter
valle fixe (fi) et le débit de réponses lent (drl). Dans le programme fi,
la première réponse émise après la fin d'un intervalle de valeur fixe
est renforcée. A chaque réponse renforcée succède un nouvel intervalle
identique. Les réponses émises en cours d'intervalle sont sans consé
quence programmée et superflues. Le développement de pauses post
renforcement, le regroupement des réponses vers la fin de l'intervalle
et l'accélération de leur débit attestent dans ce programme le déve
loppement d'une régulation temporelle qui n'est en fait pas imposée
par les contingences. Par contre, dans le programme drl, l'espacement
des réponses est la condition d'obtention du renforcement. Ainsi, dans
un programme drl de 20 s, tout intervalle interréponses (irt) inférieur
à ce délai critique est sanctionné par une remise à zéro du mécanisme
1. Chargée de recherche fnrs.
2. 32, boulevard de la Constitution, 4020 Liège (Belgique). 164 H. Le jeune
de contrôle du délai. La régulation temporelle est attestée par une
augmentation de la fréquence relative des valeurs d'mT renforcés,
par rapport aux irt trop courts.
La mauvaise performance de certaines espèces animales dans le
programme drl est un fait bien connu. Chez le Pigeon, Reynolds (1964)
et Staddon (1965) ont décrit les caractéristiques des intervalles inte
rréponses et la littérature s'accorde à déterminer la limite d'un compor
tement efficace aux environs d'une dizaine ou au plus une quinzaine
de secondes (Kramer et Rilling, 1970). La performance du Pigeon se
rapproche de celle de la Souris, qui est la plus médiocre (Maurissen, 1970).
Souris et Pigeon sont dépassés par le Rat (Ferraro et al., 1965), le
Chat (Macar, 1969, 1971 b) et le Singe (Brady et Conrad, 1960 ; Hodos
et al., 1962 ; Weiss et al., 1966) qui ont des performances de meilleure
qualité. Toutes les espèces étudiées jusqu'à présent s'adaptent par
contre à des valeurs d'intervalle fixe (fi) qui dépassent largement la
minute (p. ex. Dews, 1965 : fi de 100 000 s chez le Pigeon). Un rapide
examen de la littérature conduit à constater que les questions au
sujet de la qualité des régulations temporelles acquises ont été posées
presque exclusivement à partir de la performance en programme drl.
Ces interrogations ont donné naissance à des travaux qui analysent la
relation entre régulation temporelle du comportement propre et discr
imination de durée de stimulus externes (p. ex. Reynolds, 1966 ; voir
aussi Richelle et Lejeune, 1977). Ces travaux ont démontré l'ind
épendance, chez une même espèce, entre ces deux aspects des régulations
temporelles acquises. Cette dissociation souligne donc l'existence de
problèmes spécifiques à la régulation du comportement propre. Cette
constatation étant faite, la question de départ reste posée. Nous disso
cierons cette question en deux aspects que nous discuterons success
ivement : en premier lieu, quelle est, en programme drl, l'origine de la
médiocre performance et des différences interspécifiques ; en second
lieu, pourquoi existe-t-il un paradoxe fi-drl chez une même espèce ?
PROGRAMME DRL. LIMITES DE PERFORMANCE
ET DIFFÉRENCES INTERSPÉCIFIQUES
II est intéressant de constater que la médiocrité des performances
enregistrées dans le programme drl renseigne en quelque sorte sur
les limites d'adaptation des espèces à ce programme, bien que peu de
travaux aient spécifiquement abordé ce problème (Catania, 1970 ;
Kramer et Rilling, 1970 ; Richardson et Loughead, 1974). Nous avons
esquissé déjà une hiérarchie entre espèces, la Souris occupant le rang
inférieur, suivie du Pigeon, des Rat, Chat et Singe qui se partagent les
meilleures performances à des délais proches de la minute ou légèrement
supérieurs. Des tentatives d'explication de la hiérarchie et des perfo
rmances ont été proposées, qui font appel à des arguments biologiques Sur un paradoxe dans i 'estimation du temps chez l'animal 165
pris au sens large. La relation entre métabolisme basai et performance
a été parfois discutée (Maurissen, 1970), mais les bases sont trop fragiles
pour établir une relation de cause à effet. Une autre relation a été
esquissée, entre l'importance de l'activité générale et V adaptation aux
régulations temporelles acquises. Cette mise en relation n'est pas sans
analogie avec la typologie pavlovienne bipolaire, au niveau d'une espèce
donnée (calme-agité), qui a de longue date été associée avec la qualité
des réflexes conditionnés au temps (Pavlov, 1927). Certains faits peuvent
être rassemblés à l'appui de cette relation : Delacour et Santacana (1967)
décrivent une relation inverse entre activité spontanée et rapidité
d'acquisition dans deux types d'apprentissages complexes et la mauv
aise régulation temporelle de la Souris en drl peut être associée au
niveau d'activité générale très élevé de cet animal (Maurissen, 1970).
Toutefois, d'autres données s'opposent à cette relation. Ainsi, une
première étude du Prosimien Perodicticus Potto Edwarsi en fi (Lejeune,
1976) a montré que cet animal très lent, au niveau d'activité générale
très faible, réalise de médiocres performances (le caractère fragmentaire
de cette première recherche et le faible nombre de séances d'apprent
issage limitent bien entendu la portée de cette constatation). L'origine
des performances médiocres et des différences interindividuelles en drl
a été recherchée dans une troisième direction, à partir d'une remise en
question de la notion d'arbitrarité de V opérant. Cette direction s'articule
à un vaste courant, mieux connu sous le vocable de contraintes biolo
giques qui pèsent sur les apprentissages, et repose sur des arguments
descriptifs et théoriques que nous examinerons rapidement.
A un premier stade, les résurgences de comportements « parasites »
décrites par Breland et Breland (1961) ont orienté la recherche vers
l'étude des relations qui peuvent exister entre l'opérant sélectionné
par l'expérimentateur et le comportement « naturel » de l'animal,
qu'il soit d'ordre manipulatoire, consommatoire ou autre. Plus spécif
iquement, le phénomène d'auto-apprentissage (autoshaping) (Brown et
Jenkins, 1968) a été le secteur privilégié à partir duquel s'est développée
l'idée d'une limitation de la performance, à cause d'une liaison entre
la réponse exigée par l'expérimentateur et l'activité de consommation
du stimulus renforçant (Hearst et Jenkins, 1974), en d'autres termes,
à cause de la présence de composants pavloviens dans les réponses
instrumentales (Hearst, 1975 ; Atnip, 1977). D'un point de vue des
criptif, Jenkins et Moore (1973) ont montré que la morphologie du
coup de bec du Pigeon dépend de la nature du renforcement (eau ou
grains). Il en est de même pour l'appui sur le levier chez le Rat
(Hull, 1977).
Au-delà d'une description des faits, ces constatations ont conduit
à une élaboration théorique poussée, décrite par Hearst et Jenkins (1974)
sous l'appellation de sign-tracking. Se fondant toujours sur les phéno
mènes d'auto-apprentissage et d'apprentissage discriminatif, les auteurs 166 H. Lejeune
ont développé une théorie de l'apprentissage qui réintroduit la liaison S-R
et l'associe étroitement à la liaison R-R/ qui est le fondement même du
conditionnement opérant. Pour Hearst et Jenkins, le stimulus, en
l'occurrence une clé-réponse par exemple, possède non seulement les
caractéristiques discriminatives auxquelles l'école skinnérienne nous a
familiarisés (le stimulus discriminatif crée l'occasion pour l'émission
d'un opérant), mais encore des propriétés déclenchantes et agit à la
manière d'un substitut du stimulus renforçant (notion pavlovienne de
substitution du stimulus, Bindra, 1972). Ce stimulus sera, en consé
quence, le lieu d'émission de comportements identiques ou fortement
liés à la réponse de consommation. Ce rôle de substitut déclencheur se
développe à partir de l'apprentissage quasi « cognitif » de la relation
entre son occurrence et la présentation du stimulus inconditionnel,
par exemple de la nourriture : il est démontré qu'en auto-apprentissage
des Pigeons captifs derrière une cloison transparente émettent immé
diatement des coups de bec sur la clé une fois libérés, s'ils ont pu au
préalable assister à l'association entre l'illumination de la clé et la
présentation subséquente de la nourriture (pour une discussion détaillée,
voir Hearst et Jenkins, 1974).
En résumé, les sujets approchent des sources stimulantes ayant été
associées préalablement avec le stimulus inconditionnel et entrent en
contact avec elles. Cette conception se démarque de l'école pavlovienne
en élargissant la notion de réaction conditionnée locale et dépourvue
de direction à des comportements dirigés et de prise de contact actif.
Ce comportement d'approche et de prise de contact se maintiendra
ultérieurement, à condition que le stimulus inconditionnel, c'est-à-dire
le renforcement en termes opérants, soit maintenu , comme l'ont démontré
Zentall et Hogan (1975). Il y a interaction entre deux types d'appren
tissage associatif, le premier (S-R) étant considéré comme plus primitif
que le second (R-R/). Ces phénomènes d'approche et de prise de contact
avec le stimulus signifiant ne se limiteraient pas aux seules situations
d'auto-apprentissage ou d'apprentissage discriminatif. Selon Moore
(1973), le modelage manuel (shaping) pratiqué dans les expériences
de conditionnement opérant au sens large pourrait s'expliquer en termes
de S-R, le sujet apprenant au fil des approximations
successives une relation de plus en plus précise entre le manipulandum
et le renforcement.
Nous voulons souligner que si les hypothèses présentées ci-dessus ne
manquent pas d'intérêt pour comprendre ce qui se passe chez le Pigeon
(à cause de la réponse de consommation du renforcement émise à haute
fréquence), leur évaluation reste encore à faire pour les autres espèces
animales où l'indépendance de la réponse opérante par rapport aux
comportements de consommation du renforcement semble à première
vue mieux assurée. Que la contrainte s'explique en termes de géné
ralisation d'un comportement de consommation du renforcement, favo- Sur un paradoxe dans l 'estimation du temps chez l'animal 167
risé par la proximité spatiale entre dispositif de réponse et dispositif
de renforcement (Sperling et al., 1977), ou obéisse à une loi de l'appren
tissage fondée sur la prédictivité du stimulus (sign-tracking de Hearst
et Jenkins, 1974), son impact sur les régulations temporelles acquises
doit encore être évalué dans le détail.
Il semble utile à ce point de la discussion de distinguer entre plusieurs
niveaux de contrainte liés à la nature de la réponse. Nous distinguerons
un premier niveau, d'ordre purement mécanique, que nous illustrerons
en disant qu'il est impossible d'obtenir d'un organisme un comportement
pour lequel sa morphologie ou sa physiologie sont inadéquats. A un
second niveau, nous distinguerons les contraintes spécifiquement liées
à une forme d'activité propre à l'espèce, que cette activité soit d'ordre
manipulatoire, consommatoire ou autre. Le coup de bec du Pigeon est
une bonne illustration pour ce niveau et nous rappellerons les travaux
qui ont montré l'insensibilité des irt courts et des coups de bec courts
à l'action différentielle du renforcement (Blough, 1963, 1966 ; Millenson,
1963, 1966; Richardson, 1973, 1976; Schwartz et Williams, 1972;
Moore, 1973 ; Schwartz, 1977). Le troisième niveau englobe les types
de comportements auxquels le second niveau fait allusion et les implique
dans des mécanismes d'apprentissage (généralisation, sign-tracking) qui
interagissent avec la forme en cours. Nous rappellerons
ici les travaux de Jenkins et Moore (1973) et de Hull (1977) qui ont
montré une relation entre la nature du renforcement et la morphologie
de la réponse opérante et ont interprété cette relation en termes
pavloviens.
Il semble que la capacité de mesure du temps d'une espèce donnée
sera masquée ou déformée selon le degré de contrainte associé à l'opérant
choisi. Dans cette optique qui subordonne le contrôle moteur à l'horloge
interne, il est utile de comparer chez une même espèce des opérants qui
diffèrent entre eux. De rares travaux ont été entrepris en ce sens (Kramer
et Rodriguez, 1971 ; Hemmes, 1975 ; Richardson et Clark, 1976 ;
Mantanus et al., 1977 a et b). Les recherches qui comparent la réponse
d'appui de la patte et le coup de bec chez le Pigeon en programme drl
n'ont pu, malgré certaines différences qui se font jour au niveau de la
distribution des intervalles interréponses, conclure à la supériorité d'un
opérant sur l'autre, ce qui semble à première vue restreindre le rôle
d'éventuels composants pavloviens de la réponse opérante choisie. Il
est impossible dès à présent de faire la part, dans une perspective
comparative, des diverses hypothèses concernant la capacité de régu
lation et d'estimation temporelle (pour une discussion plus détaillée
de ces hypothèses, voir Richelle et Lejeune, 1977).
En conclusion, et au stade actuel du développement des recherches,
il semble que des arguments biologiques ne nous offrent pas une base
assez large pour comprendre la performance des différentes espèces
étudiées en programme drl. La prise en considération de caractéris- 168 H. Lejeune
tiques biologiques ou éthologiques ouvre toutefois une perspective de
recherche des plus intéressantes, car elles semblent à l'origine de nomb
reuses contraintes qui pèsent sur les régulations temporelles acquises
et ont sans aucun doute partie liée avec les mécanismes régulateurs de
l'inhibition (Itichelle et Lejeune, 1977) auxquels nous reviendrons plus
loin. Nous soulignerons enfin qu'en eux-mêmes, les arguments biolo
giques ne nous offrent aucune explication du paradoxe fi-drl. En effet,
les contraintes liées au métabolisme, à l'activité générale ou à la nature
de la réponse sont a priori présentes, quel que soit le type de régulation
temporelle auquel est soumis l'animal (pour distinguer les régulations
temporelles acquises, voir Richelle et Lejeune, 1977). Comment dès
lors comprendre que le Pigeon, qui, en drl, n'espace efficacement ses
réponses que de quelques secondes, présente des pauses postrenforcement
qui excèdent de loin la minute en fi 100 000 s (Dews, 1965) et que la
Souris dont les distributions d'intervalles interréponses sont presque
aléatoires en drl fasse de même en fi 4 mn (Maurissen, 1970). Force
est de nous tourner vers d'autres données : nous tenterons dans les
paragraphes suivants d'approcher le paradoxe fi-drl en recherchant
ce qui différencie les deux apprentissages.
PARADOXE FI-DRL
ET DIFFÉRENCES ENTRE LES DEUX APPRENTISSAGES
Une première différence se dégage au niveau des opérants sélectionnés.
Si nous restons fidèles à la description des contingences de renforcement,
la conception de V intervalle interréponse comme dimension de la réponse
opérante, intervalle qui est l'objet de différenciation temporelle par
l'action du renforcement (Catania, 1970), permet de cerner une différence
entre programme fi et drl, ce dernier se caractérisant par une régu
lation temporelle imposée (l'espacement des réponses est la condition
même du renforcement), à l'opposé de la régulation temporelle dite
« libre », c'est-à-dire « facultative », du programme fi. Dans le cas du
drl, I'irt clôturé par l'émission d'une réponse est l'opérant sur lequel
agit le renforcement. Dans le cas du fi, seule l'émission d'une réponse
est requise pour l'obtention du renforcement. En d'autres termes,
l'action sélective du renforcement agit sur des classes d'opérants diffé
rents. Cette distinction n'empêche pas que puisse se développer, dans
les faits, une sélection de certaines classes d'intervalles interréponses en
programme fi (Williams, 1968 ; Dews, 1970 ; Shull et Brownstein, 1970),
tout comme il se développe des effets séquentiels en programme drl
(pour une discussion détaillée, voir entre autres Kramer et Rilling, 1970).
Une seconde différence se dégage de la littérature : l'absence de chaînes
de réponses (Anger, 1963) en FI, par opposition au programme DRL où
elles ont été observées très souvent (Wilson et Keller, 1953 ; Hodos et al.,
1962 ; Laties et al., 1965 ; McMillan, 1969 ; Laties et al., 1969 ; Schwartz Sur un paradoxe dans l'estimation du temps chez l'animal 169
et Williams, 1971 ; Pouthas, 1974 ; Lince, 1976, entre autres). L'absence
de chaînes de réponses on fi a été démontrée par la série de travaux de
Dews (1965, 1970) et Wall (1965) qui fragmentent l'émission des réponses
en cours d'intervalle par une succession de périodes où est présenté un
stimulus non corrélé au renforcement et qui contrôle la non-réponse. Il
faut toutefois préciser que la présence de conduites collatérales n'a pas
été décrite dans tous les cas en drl (Kelleher et al., 1959 ; Lince, 1976)
et qu'elles ne sont pas toujours associées à une amélioration de l'eff
icience (Lince, 1976 ; pour une discussion plus détaillée, voir Richelle
et Lejeune, 1977). Si nous nous interrogeons au sujet de l'origine de
ces conduites collatérales, retrouvons la dualité de mécanismes
d'apprentissage dont nous avons discuté plus haut : action sélective
du renforcement, sur le mode superstitieux (Skinner, 1948, 1961), ou
conditionnement pavlovien. Ainsi, Staddon et Simmelhag (1971) obser
vent l'apparition de comportements liés à la consommation de la nourri
ture et qui surviennent préalablement à sa distribution. Ces compor
tements ne pouvant s'expliquer par la loi de l'effet, puisqu'ils retardent
la distribution de la nourriture, les auteurs émettent l'hypothèse du
développement de réactions conditionnées à la présentation de la nourri
ture et qui sont anticipées.
Certaines hypothèses quant aux mécanismes qui sous-tendent les
régulations temporelles acquises se fondent spécifiquement sur l'exis
tence de ces conduites collatérales qui agissent en médiateurs de la
durée. A la limite, elles aboutissent à la négation d'une régulation tem
porelle en drl (la réponse définie par le programme étant l'aboutissement
d'un enchaînement de comportements sélectionnés par le renforce
ment : Reynolds et McLeod, 1970), tout comme l'explication en termes
d'un contrôle exercé par un débit de renforcement sur un débit de
réponses (Richardson, 1976). Quoi qu'il en soit des diverses hypothèses
proposées, nous retiendrons que, sur la base de la définition des contin
gences de renforcement, le programme drl exige la différenciation
temporelle d'aspects du comportement (irt clôturé par l'émission de
la réponse), alors que le programme fi n'exige pas cette différenciation.
Nous en tirerons argument au cours de la discussion finale.
Nous distinguerons une troisième différence au niveau de ce que
nous appellerons la structure des apprentissages. Un ensemble de faits
rassemblés au laboratoire de psychologie expérimentale de l'Université
de Liège, ainsi que d'autres données (Zeiler, 1968 ; Killeen, 1975 ;
Corfield-Sumner et Blackman, 1976 ; Baron et Galizio, 1976), per
mettent d'accorder un statut très particulier aux contingences du
programme à intervalle fixe. Paul Fraisse (1967) et Malone (1971)
soulignent l'analogie existant entre les « rythmes conditionnés au
temps » des pavloviens et le programme opérant à intervalle fixe. Il
suffit de pousser l'analogie plus loin pour considérer que les inductions
de rythmes observées par les pavloviens au niveau glandulaire (Feokri- 170 //. Lejeune
tova, 1912) ou même au niveau des ondes cérébrales (la « cyclochronie »
de Popov, 1950) sont les analogues du phénomène de courbe « en
festons » (scalloping) dans un programme fi, l'émission de plus en
plus accélérée des réponses opérantes offrant un parallèle des émissions
salivaires de plus en plus abondantes. De plus, lorsque dans un pr
ogramme fi on effectue un passage abrupt d'une valeur d'intervalle
à une autre, il persiste pendant un certain temps une superposition
de deux « rythmes » comportementaux, l'ancien intervalle modulant en
filigrane la rapide adaptation au nouvel intervalle.
Si nous définissons la structure d'un apprentissage en termes de
distribution des renforcements primaires et des stimulus associés en
fonction du temps, nous soulignerons que la structure régulière ou
périodicité du programme à intervalle fixe, c'est-à-dire la distribution
à intervalles récurrents du renforcement primaire et des stimulus
associés, semble jouer un rôle particulier.
Deux ordres de faits nous permettent une première analyse de ce
rôle. En premier lieu, des travaux psychophysiologiques ont mis en évi
dence des effets différentiels de lésions thalamiques médianes (complexe
centre-médian-parafasciculaire) en programme fi et drl chez le Rat
albinos : la performance dans le à intervalle fixe n'est pas
modifiée alors qu'on observe une augmentation significative du débit
de réponses et une réduction significative du débit de renforcement
dans le programme drl (Lejeune, 1974, 1977). Le complexe centre-
médian-parafasciculaire du thalamus du Rat peut être considéré comme
une structure qui intègre les contingences et sélectionne les comporte
ments eh fonction de ces (Delacour, 1968, 1971 ; Alexinsky,
1973 ; Lejeune, 1974). L'effet différentiel pourrait s'interpréter comme
si, en programme fi, la prégnance de la structure périodique du pr
ogramme, dont l'action s'exercerait à la façon d'un synchroniseur de
rythme biologique, créait les conditions suffisantes à un masquage du
traumatisme lésionnel et permettait une vicariance immédiate. Par
contre, en programme drl, tout se passe comme si, face à la difficulté
de lecture temporelle de la structure du programme, le système nerveux
central avait élaboré une stratégie émergeant à la faveur d'une très
lente différenciation temporelle (Catania, 1970), ou d'une sélection de
comportements de remplissage (Reynolds et McLeod, 1970) ou encore
d'une simple action du débit global de renforcement sur le débit de
réponses (Richardson, 1976). Cette stratégie sera dès lors ébranlée
par suite de la destruction de structures nerveuses impliquées dans son
élaboration. Ces données, bien que très fragmentaires, attirent à nou
veau l'attention sur le statut particulier de la périodicité des contin
gences FI.
Cette interprétation basée sur les effets lésionnels semble confirmée
par un deuxième ordre de faits, c'est-à-dire l'analyse du rôle des stimulus
associés à la distribution du renforcement dans les programmes fi et drl. Sur un paradoxe dans l 'estimation du temps chez Vanimal 171
Deliège (1975) a montré que la suppression des stimulations visuelles
et auditives associées au renforcement conduit à une désorganisation
progressive du comportement préalablement acquis en programme fi :
le débit de réponses et l'efficience baissent ; le « feston » disparaît et l'on
s'achemine vers une extinction généralisée alors que les contingences
originales du programme restent en vigueur. Les stimulus associés au
renforcement primaire agissent comme des renforcements conditionnés
très puissants. Aussitôt ces stimulus réinstallés, on peut observer une
réapparition très rapide du comportement caractéristique du pr
ogramme fi. La suppression des mêmes stimulus visuels et auditifs en
programme de débit de réponses lent reste par contre sans effet
significatif.
Des données de Lejeune (1974, 1977) et Deliège (1975) nous retien
drons que la régularité de structure d'un apprentissage ou, en d'autres
termes, sa périodicité, exerce un contrôle extrêmement pregnant sur la
performance des sujets. Les mécanismes précis de ce contrôle doivent
toutefois encore être décrits. Cette régulation ou périodicité exerce un
contrôle qui n'est pas sans analogie avec ceux décrits dans le cadre des
études chronobiologiques, c'est-à-dire qu'elle fonctionne comme un
synchroniseur externe de l'activité opérante. Cette facilitation des ajus
tements temporels par la périodicité de la structure des contingences
conduit à opérer une distinction entre fonction sélective et fonction syn
chronisante d'un événement renforçant (primaire et conditionné). Cette
fonction synchronisante se superposerait à la fonction sélective dans le
programme à intervalle fixe et sous-tendrait le découpage pause-
activité, le débit des réponses, et l'accélération de ce débit en fin
d'intervalle.
Nous ajouterons encore à l'appui de ces hypothèses que Zeiler (1968)
observe un pattern de réponses accéléré en programme à temps fixe (fixed-
time : ft) de 5 mn où la distribution du renforcement est non-contingente
de la réponse (acquise au préalable) et souligne que le pattern de réponses
est principalement déterminé par la distribution du renforcement en
relation au temps (on n'observe pas de pattern de réponse accéléré en
programme « à temps variable » (variable-time) de 5 mn). Killeen (1975)
décrit dans le même programme l'alternance régulière de phases d'acti
vité non opérante (interim activity) en début d'intervalle et de réponse en
fin d'intervalle. En second lieu, Corfield-Sumner etBlackman (1976) ont
pu montrer, dans des programmes de second ordre où le comportement
en programme fi est renforcé selon un programme à proportion, que les
comportements des composants fi contrôlés par des stimulus brefs
qui n'ont jamais été associés auparavant au renforcement et qui sont
présentés au lieu du renforcement primaire sont analogues à ceux des
composants fi terminés par la présentation du primaire.
Le comportement typique du fi se maintient à condition que des stimul
ations périodiques soient présentes. L'analogie entre pattern fi contrôlé

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.