La lecture en ligne est gratuite
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Partagez cette publication

Ludovic Ferrand
Accès au lexique et production de la parole: un survol
In: L'année psychologique. 1994 vol. 94, n°2. pp. 295-311.
Résumé
Cet article présente une synthèse basée sur des données expérimentales et des erreurs de production (chez des sujets normaux
et des aphasiques) concernant l'accès au lexique dans la production de la parole. La distinction classique entre les processus de
sélection lexicale et les processus d'encodage phonologique sert de point de départ. Ensuite, nous examinons les données de la
littérature nous renseignant sur le profil temporel de l'activation des informations sémantiques et phonologiques. Ceci nous
amène à confronter deux théories majeures et opposées. La première théorie prenant la forme d'un modèle discret à deux
étapes, est modulariste: aucun encodage phonologique n'a lieu avant la sélection lexicale. La seconde théorie est
connexionniste: elle soutient l'existence d'une interaction continuelle entre ces deux processus. Pour finir, une réconciliation des
théories modularistes et connexionnistes est proposée.
Mots clefs: production de la parole, modularité et connexionisme, accès au lexique.
Abstract
Summary : Lexical access in speech production : A briefreview.
This article provides a brief review of experimental and speech error data (in normal subjects and aphasic patients) concerned
with lexical access in speech production. We start from the old distinction between two major processes involved in speech
production, namely, lexical selection ofthe appropriate word from thousands of alternatives in the mental lexicon and phonological
encoding of the corresponding word in order to compute its articulatory program. Then, we review data tracing the time-course of
semantic and phonological activation, contrasting by the way two major and opposite conceptions of lexical access in speech
production. The jirst view, called the two discrete stages theory is a modular view: there is no phonological encoding before
lexical selection. The second view is a connectionist one: there is continuing interaction between the two processes. Finally, a
reconciliation of modular and interactive accounts is proposed.
Key words: speech production, modularity and connectionism, lexical access.
Citer ce document / Cite this document :
Ferrand Ludovic. Accès au lexique et production de la parole: un survol. In: L'année psychologique. 1994 vol. 94, n°2. pp. 295-
311.
doi : 10.3406/psy.1994.28759
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1994_num_94_2_28759L'Année psychologique, 1994, 94, 295-312
REVUE CRITIQUE
Laboratoire de Psychologie Expérimentale
CNRS URA 316, EPHE
Université René Descartes, Paris V1
ACCÈS AU LEXIQUE ET PRODUCTION
DE LA PAROLE : UN SURVOL 2
par Ludovic Ferrand
SUMMARY: Lexical access in speech production : A brief review.
This article provides a brief review of experimental and speech error
data fin normal subjects and aphasie patients) concerned with lexical
access in speech production. We start from the old distinction between
two major processes involved in speech production, namely, lexical selec
tion of the appropriate word from thousands of alternatives in the mental
lexicon and phonological encoding of the corresponding word in order to
compute its articulatory program. Then, we review data tracing the time-
course of semantic and phonological activation, contrasting by the way
two major and opposite conceptions of lexical access in speech product
ion. The first view, called the two discrete stages theory is a modular
view: there is no phonological encoding before lexical selection. The
second view is a connectionist one: there is continuing interaction be
tween the two processes. Finally, a reconciliation of modular and interact
ive accounts is proposed.
Key words: speech production, modularity and connectionism, lexical
access.
1. 28 rue Serpente, 75006 Paris.
2. Dans cet article, nous nous limitons à la production de mots isolés. Il
existe par ailleurs une vaste littérature concernant la production de phrases.
Nous renvoyons le lecteur intéressé à l'ouvrage de Levelt (1989) pour une
vue exhaustive des processus impliqués dans la production de la parole (de
l'intention à l'articulation). Ludovic Ferrand 296
INTRODUCTION
Le problème de l'accès au lexique dans la production de la
parole se pose en des termes assez simples : comment le locu
teur a-t-il accès aux mots quand il parle? Comment choisit-il
le mot désiré au sein d'un lexique mental en comprenant plu
sieurs milliers? Comment fait-il pour passer d'un concept à la
production d'un mot correspondant? Comme le font remar
quer Butterworth (1989) et Levelt (1992), trouver le mot appro
prié au cours d'une conversation, ou le nom d'un objet dans
une tâche de dénomination, n'est pas un problème trivial. Olfield
(1963) estime le nombre de mots qu'un locuteur adulte normal
connaît à environ 75 000. Par ailleurs, Levelt (1989, 1992)
estime la taille du lexique de production à environ 60 000 mots.
Sachant qu'un locuteur normal produit en moyenne 100 à
200 mots par minute (Maclay et Osgood, 1959; Deese, 1984),
le problème de l'accès au lexique dans la production de la
parole se résume à consulter le Petit Larousse, qui possède
environ 75 000 entrées, deux ou trois fois par seconde! De
plus, ce véritable talent cognitif est renforcé par le fait qu'un
locuteur fait très peu d'erreurs de production. Garnahm, Shil-
lock, Brown, Mill et Cutler (1982) ainsi que Butterworth (1992)
estiment ce taux d'erreurs à un pour mille. Pour finir, nous ne
sommes absolument pas conscients de la façon dont nous pro
cédons. De ce fait, l'introspection, comme le fait remarquer
Levelt (1992), est largement inutile.
En fait, deux approches devenues classiques sont utilisées
pour étudier les processus sous-jacents à l'accès au lexique
dans la production de la parole. La première approche (la plus
ancienne) est basée sur les erreurs de productions chez des
sujets normaux (Cutler, 1982; Fromkin, 1973; Garett, 1975) ou
chez des malades (Bub et Caplan, sous presse; Butterworth,
1992). La seconde approche, plus récente et devenue majeure,
fait appel à des paradigmes de temps de réaction pour étudier
l'accès au lexique (Olfield et Wingfield, 1965).
Selon les psycholinguistes, trois types de processus men
taux sont impliqués dans la production de la parole (Bock,
1982, 1986; Dell, 1986; Garett, 1975, 1988; Kempen et Hoen-
kamp, 1987; Kempen et Huijbers, 1983; Levelt, 1983; pour une
revue des processus sous-jacents à la production de la parole,
voir en particulier Levelt, 1989). Premièrement, les processus
de conceptualisation spécifient les concepts qui doivent être Accès au lexique et production 297
exprimés verbalement. Deuxièmement, au cours de ce que
Levelt (1989) appelle processus de formulation, les mots approp
riés aux concepts à exprimer sont récupérés (sélectionnés)
dans le lexique mental (accès au lexique) : une représentation de
la structure syntaxique de l'expression est générée (encodage
syntaxique) et la structure phonologique correspondant à cette
expression est déterminée (encodage phonologique). Troisième
ment, les processus d'articulation transforment cette structure
phonologique en parole.
SÉLECTION LEXICALE
ET ENCODAGE PHONOLOGIQUE : DEUX ÉTAPES
L'accès au lexique dans la production du langage parlé est
classiquement vu comme comprenant deux étapes :
1) la récupération des lemmas (ou sélection lexicale) ;
2) l'encodage phonologique ou récupération des lexemes (e.g.
Butterworth, 1989; Dell, 1986; Fromkin, 1971; Garrett, 1975;
1988; Kempen et Hoenkamp, 1987; Levelt, 1983, 1989).
La récupération d'un lemma correspond à l'activation et à
la sélection d'un lemma (selon la terminologie de Kempen et
Huijbers, 1983) sur la base de l'information conceptuelle qui
doit être exprimée oralement. Les lemmas représentent le sens
et les propriétés syntaxiques d'un mot. La récupération des
lemmas est une composante cruciale du processus d'encodage
syntaxique. Comment se fait la récupération des lemmas? Le
choix et la rapidité de la récupération d'un item sémantique-
ment approprié au contexte phrastique implique deux proces
sus majeurs. Le premier processus fait intervenir un trait
ement en parallèle des items sélectionnés. Il semble en effet
impensable que pour la récupération d'un lemma particulier,
tous les lemmas du lexique mental soient vérifiés l'un après
l'autre jusqu'à appariement du concept à exprimer avec le
lemma correspondant. Il faut donc postuler une activation en
parallèle des lemmas proches sémantiquement. D'ailleurs, les
erreurs spontanées de production témoignent d'une activation
simultanée de plusieurs synonymes de l'item à exprimer (Fromk
in, 1973). Le second mécanisme important est le mécanisme
de convergence: l'algorithme de récupération des lemmas
(quel qu'il soit) doit nécessairement converger vers un item et
un seul, celui dont le concept doit être exprimer. Levelt (1989) 298 Ludovic Ferrand
montre qu'une bonne théorie de la récupération des lemmas
doit pouvoir expliquer comment un item lexical est récupéré co
rrectement conformément aux intentions conceptuelles du locu
teur. Cela pose de nombreux problèmes que nous n'aborderons
pas ici (voir en particulier Levelt, 1989 et Roelofs, 1992).
La seconde phase de l'accès au lexique dans la production
de la parole correspond à l'encodage phonologique. L'enco
dage phonologique est le processus conduisant à la construc
tion d'un programme articulatoire. Ce processus implique la
récupération des morphèmes et des segments de parole (nous
renvoyons le lecteur intéressé à Dell, 1988; Meyer, 1990; 1991;
Meyer et Schriefers, 1991 pour plus de détails concernant les
processus d'encodage phonologique).
Cette conception en deux étapes de l'accès au lexique au
cours de la production de la parole (sélection lexicale du sens
du mot et récupération de sa forme phonologique correspon
dante) a permis d'expliquer des données provenant:
1) des erreurs normales de production (e.g. Dell et Reich,
1981; Fromkin, 1971; Garrett, 1975) et du phénomène du
mot sur le bout de la langue (Brown et McNeill, 1966; Jones
et Langford, 1987);
2) des erreurs de patients aphasiques (e.g. Butterworth, 1989;
1992);
3) d'une variété de paradigmes expérimentaux (Levelt, Schrie-
fers, Vorberg, Meyer, Pechmann et Havinga, 1991 ; Meyer et Levelt, 1990).
1. Erreurs normales de production et phénomène du mot sur
le bout de la langue
Fromkin (1973) observe deux types d'erreurs de production
dans des conversations spontanées. Dans le premier type
d'erreurs, le locuteur échange un mot similaire sémantiquement
à la cible mais qui diffère phonologiquement. Par exemple, le
locuteur produit «oral» à la place de «written» dans la phrase
«... part of the exam».
Dans le second type d'erreurs, le locuteur échange un mot
similaire phonologiquement mais pas sémantiquement. Par
exemple, le locuteur produit «present» à la place de «pres
sure» dans le contexte «while the... indicates». au lexique et production 299 Accès
Cette distinction entre erreurs purement sémantiques et
erreurs purement phonologiques s'accorde avec l'idée de deux
étapes (indépendantes) impliquées dans l'accès au lexique. Les
erreurs de substitutions sémantiques auraient lieu au cours de
la première étape de l'accès lexical où seules les caractéris
tiques sémantiques des mots sont considérées. Par contre, les
erreurs de phonologiques auraient lieu au cours
de la deuxième étape de l'accès lexical, où les caractéristiques
phonologiques des mots sont considérées. Une des versions la
plus connue de ce modèle à deux étapes a été développée par
le passé par Garrett (1975, 1976, 1980, 1982). Dans son modèle,
la première étape de l'accès au lexique intervient au niveau
fonctionnel, dans lequel une caractérisation abstraite du mot
est sélectionnée (et associée avec son rôle grammatical). Par
exemple, une erreur au niveau fonctionnel, telle que l'échange
de deux mots (oral-written) est sensible aux propriétés sémant
iques et syntaxiques des mots mais insensible aux informat
ions du niveau positionnel, telles que la forme phonologique
des mots.
Toutefois, Dell et Reich (1981) présentent des données sta
tistiques montrant que les erreurs de sélection (sémantiques)
et les erreurs d'encodage phonologique ne sont pas complète
ment indépendantes. De plus, il existe l'effet dit de «biais lexi
cal» (reporté initialement par Baars, Motley et MacKay, 1975)
qui signifie qu'une difficulté à encoder phonologiquement tend
à créer des mots réels plus fréquemment qu'attendu par la
chance. Les créés par erreurs phonologiques sont sou
vent sémantiquement appropriés au contexte. Par exemple:
«stop-start» et «cat-rat».
Ces résultats ont été répliqués par Harley (1984), Dell
(1986), Martin, Weisberg, et Saffran (1989) et constituent un
défi pour les théories modularistes à deux étapes strictement
successives de l'accès au lexique. Ces interactions entre sélec
tion lexicale et encodage phonologique trouvent une explicanaturelle par les modèles connexionnistes de l'accès au
lexique (Dell, 1986, 1988). Ces modèles permettent une activa
tion interactive entre les deux niveaux de représentations, ren
dant ainsi compte de l'effet de biais lexical (Stemberger, 1985;
Dell, 1986). Cette opposition entre théories modularistes et
théories interactionnistes est discutée plus en détail dans la
section suivante. L'unique but de la présente section est de
montrer l'existence de deux étapes impliquées dans la produc- 300 Ludovic Ferrand
tion de la parole, sans montrer si ces étapes sont interactives
ou indépendantes.
Dans le phénomène du mot sur le bout de la langue, le locu
teur connaît le mot à produire, peut arranger le contexte syn
taxique de manière appropriée mais bloque complètement ou
en partie sur la récupération de la forme phonologique (Brown
et McNeill, 1966; Levelt, 1989). Jones et Langford (1987) mont
rent en particulier que ce blocage au niveau de la seconde
étape (encodage phonologique) peut être induit ou aggravé en
présentant au locuteur un mot phonologiquement relié à la cible
(par exemple, «secant» quand le mot cible est «sextant»). Tout
efois, un distracteur sémantique (par exemple, «latitude») n'a
aucun effet. Ces données supportent l'idée que le mot sur le
bout de la langue est récupéré sur des bases sémantiques. Par
contre, la récupération de la forme phonologique fait défaut. Ce
phénomène est considéré comme un argument phénoménologi
que convaincant pour avancer que l'accès au lexique au cours
de la production de la parole passe par deux étapes, à savoir
une étape sémantique et une étape phonologique (Butterworth,
1989; Levelt, 1989).
2. Données de la neuropsychologie
Les données de la permettent également
de distinguer un niveau de sélection lexicale et un niveau d'en
codage phonologique. Certains patients aphasiques peuvent
dénommer des objets sans pouvoir les reconnaître (Kremin,
1986, 1988) alors que d'autres patients (anomiques) peuvent
utiliser et décrire correctement des objets sans pouvoir les
nommer à haute voix (Ellis, 1985; Ellis et Young, 1988; Kay et
Ellis, 1987). En particulier, Kay et Ellis (1987) présentent un
patient anomique, EST, qui a d'énormes difficultés pour dénom
mer des objets (que la présentation soit visuelle, tactile ou des
criptive). Par contre, EST reconnaît parfaitement bien les objets
présentés et ne présente pas de troubles perceptifs ou concept
uels. Encore une fois, une conception en deux étapes de l'accès
au lexique rend aisément compte de ces résultats. Bien que la
neuropsychologie ne s'intéresse pas particulièrement à la dis
tinction entre un niveau sémantique et un niveau phonolo
gique, l'observation de déficits spécifiques à l'un ou l'autre de
ces niveaux chez des patients différents soutient un modèle de
l'accès au lexique à deux étapes. Accès au lexique et production 301
3. Paradigmes expérimentaux de temps de réaction
Dans une étude récente, Schriefers, Meyer et Levelt (1990)
utilisent un paradigme d'interférence dans lequel les sujets
doivent dénommer des images d'objets pendant qu'on leur pré
sente auditivement des mots distracteurs. La variable dépen
dante est le temps de dénomination.
Les différentes conditions expérimentales concernent le type
de relations entre l'image à dénommer et le distracteur ainsi
que l'ordre temporel de présentation du par rap
port à l'image. Les relations entre l'image et le distracteur
peuvent être purement sémantiques (ex. l'image présentée est
celle d'un chien («dog») et le distracteur est «cat»), purement
phonologiques (ex. «dog» et «fog») ou inexistantes («dog» et
«house»). L'ordre temporel de présentation du distracteur est
varié: sa présentation se fait soit légèrement avant l'apparition
de l'image (- 150 msec), soit en même temps que l'image, soit
légèrement après l'image (+ 150 msec). Les résultats montrent
un effet d'interférence sémantique (la présentation auditive du
mot «cat» ralentit la dénomination de l'image «dog») seule
ment quand le distracteur est présenté 150 msec avant l'image
cible, et un effet de facilitation phonologique (la présentation
auditive de «fog» facilite la dénomination de l'image «dog»)
seulement quand le distracteur est présenté pendant ou 150 msec
après l'image.
Ces résultats expérimentaux supportent la position clas
sique selon laquelle l'accès au lexique au cours de la product
ion de la parole comprend deux étapes successives, indépen
dantes et discrètes. Les auteurs concluent à l'existence d'une
étape purement sémantique, dans laquelle seules les propriét
és sémantiques du mot à produire sont activées, suivie d'une
étape où seules les propriétés phonologiques sont activées à
leur tour.
PROFIL TEMPOREL DE L'ACCÈS AU LEXIQUE : MODULAR
ITÉ OU INTERACTIVITÉ ?
Nous avons vu que la production d'un mot semble comport
er deux processus majeurs. Le premier processus consiste à
sélectionner le mot approprié parmi plusieurs milliers de poss
ibilités dans le lexique mental. Le second corres- Ludovic Ferrand 302
pond au calcul d'un programme articulatoire correspondant au
mot sur la base de sa représentation phonologique abstraite.
Est-ce que ces deux processus se recouvrent temporellement,
permettant des interactions mutuelles, ou au contraire, sont-
ils strictement successifs ?
Le premier point de vue défendu par les modularistes et pre
nant la forme de modèles discrets à deux étapes (Butterworth,
1989; Garrett, 1988; Levelt, 1989; Levelt et al. 1991; Schrie-
fers, Meyer et Levelt, 1990) soutient l'idée qu'aucun encodage
phonologique n'a lieu avant la sélection lexicale, et donc inter
dit un quelconque feedback de l'encodage phonologique vers
la sélection lexicale. De ce point de vue, la sélection lexicale et
l'encodage phonologique se produisent en étapes strictement
successives. Le second point de vue défendu par les partisans du
connexionnisme et prenant la forme de modèles à activation-
interactive (Dell, 1985; 1986; 1988; Humphreys, Riddoch et
Quinlan, 1988; MacKay, 1987; Stemberger, 1985) ou modèles à
traitement parallèle distribué (Dell et Juliano, 1991) soutient
l'existence d'un recouvrement temporel de la sélection lexicale
et de l'encodage phonologique, et une interaction continue entre
ces deux processus. Cette relation temporelle entre la sélection
lexicale et l'encodage phonologique est dite «en cascade»: une
fois le processus de sélection lexicale commencé, le processus
d'encodage phonologique est également enclenché.
Nous avons vu précédemment qu'une indépendance totale
entre les niveaux sémantiques et phonologiques était remise
en question par l'effet de biais lexical observé par Dell et Reich
(1981), Harley (1984) et Martin et al. (1989). En particulier,
Dell (1986, 1988) propose un modèle connexionniste permet
tant des interactions entre la sélection lexicale et l'encodage
phonologique. Levelt et al. (1991) se proposent de confronter
les deux théories (modulariste et interactionniste) en testant
expérimentalement à l'aide d'un paradigme de temps de réac
tion, plutôt que de se baser sur des corpus d'erreurs, le profil
temporel de l'accès au lexique. En effet, les deux théories peu
vent faire des prédictions précises et contrastées sur le profil d'activation des informations sémantiques et phonol
ogiques. D'après Levelt et al. (1991), trois prédictions majeu
res peuvent être faites :
— La première prédiction concerne le profil temporel de
l'activation sémantique: les théories modularistes prédisent une
activation sémantique précoce uniquement mais pas tardive; Accès au lexique et production 303
les théories connexionnistes prédisent une activation sémantique
précoce suivie d'un rebond plus tardif, qui serait dû au feed
back du niveau phonologique vers le niveau sémantique.
— La seconde prédiction concerne le profil temporel de
l'activation phonologique: les théories modularistes prédisent
une activation phonologique tardive uniquement; les théories
connexionnistes prédisent une activation phonologique à la
fois précoce et tardive.
— La troisième prédiction concerne la présence ou l'ab
sence d'une activation phonologique des items sémantique-
ment proches: les théories modularistes interdisent l'activation
phonologique d'alternatives sémantiques : seul le mot sélectionné
sera encode phonologiquement; les mots co-activés sémantique-
ment ne seront pas encodes phonologiquement. D'un autre
côté, les théories connexionnistes prédisent une activation pho
nologique de tous les mots co-activés sémantiquement.
Levelt et al. (1991) conduisent plusieurs expériences pour
tester empiriquement ces prédictions. La tâche des sujets est
de nommer à haute voix des images d'objets. De plus, le sujet
réalise une tâche secondaire de décision lexicale. Rapidement
après la présentation de l'image à dénommer, les sujets enten
dent un item qui correspond soit à un mot, soit à un non-mot.
À ce moment précis, les sujets doivent faire une décision lexi
cale (décider si l'item auditif est un mot réel ou non). Les différen
tes conditions expérimentales concernent les relations entre
l'image et le mot-cible ainsi que leur ordre temporel de pré
sentation. Les relations entre l'image et le mot-cible peuvent
être de nature sémantique (ex. image d'un mouton («sheep»),
mot auditif «goat»), de nature phonologique (ex. sheep-sheet)
ou inexistantes (ex. sheep-house). Considérons que l'image à
dénommer est celle d'un mouton: les sujets vont générer les
représentations sémantiques et phonologiques internes approp
riées à l'image présentée. Ainsi, pour tester l'activation sémant
ique de «sheep», les auteurs présentent en décision lexicale
le mot «goat» (relié sémantiquement). De la même façon, pour
tester l'activation phonologique de «sheep», les auteurs pré
sentent le mot «sheet» (relié phonologiquement). Pour étudier
comment ces représentations phonologiques et sémantiques se
développent au cours du temps, Levelt et ses collègues présent
ent l'item cible auditivement à différents moments après la
présentation de l'image (à 73 msec, 373 msec et 673 msec).

Un pour Un
Permettre à tous d'accéder à la lecture
Pour chaque accès à la bibliothèque, YouScribe donne un accès à une personne dans le besoin