Le traitement d'un langage artificiel - article ; n°2 ; vol.77, pg 405-415

De
Publié par

L'année psychologique - Année 1977 - Volume 77 - Numéro 2 - Pages 405-415
Résumé
Dans les expériences ordinaires de psycholinguistique, il est difficile sinon impossible de différencier le rôle de la syntaxe de celui de la sémantique. Dans l'expérience présente, entièrement contrôlée par ordinateur, l'utilisation d'éléments artificiels qui ne convoient aucune signification particulière pour les sujets, permet d'étudier isolément les effets de la complexité formelle d'une phrase sur son temps de décodage. Les structures retenues comportent des enchâssements et des transformations passives. Certaines de ces structures sont isomorphes à des phrases des langues naturelles. Et au plan des résultats l'ordre de difficulté trouvé ici avec des phrases artificielles est en parfait accord avec celui qui a pu être trouvé par ailleurs avec des phrases naturelles. Au demeurant, un modèle simple du sujet, basé sur des opérations de mise en relation et d'inversion, se trouve validé par les résultats.
Summary
In current experiments in psycholinguistics, it is very difficult if not impossible to differentiate the role of syntax from the role of semantics. In the present experiment, the use of artificial elements that do not convey any particular meaning enables us to study separately the influence of the formai complexity of the sentence on the processing duration.
The material is composed of embedded structures and passive forms. Some of these structures are isomorphic to natural language sentences. The results show that durations for processing artificial sentences are ordered in the same fashion as durations for processing natural sentences. The results validate a model of the subject based on relation operations and inversion operations.
11 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : samedi 1 janvier 1977
Lecture(s) : 10
Nombre de pages : 12
Voir plus Voir moins

Pierre Bovet
J.-P. Le Moan
Juan Segui
Le traitement d'un langage artificiel
In: L'année psychologique. 1977 vol. 77, n°2. pp. 405-415.
Résumé
Dans les expériences ordinaires de psycholinguistique, il est difficile sinon impossible de différencier le rôle de la syntaxe de celui
de la sémantique. Dans l'expérience présente, entièrement contrôlée par ordinateur, l'utilisation d'éléments artificiels qui ne
convoient aucune signification particulière pour les sujets, permet d'étudier isolément les effets de la complexité formelle d'une
phrase sur son temps de décodage. Les structures retenues comportent des enchâssements et des transformations passives.
Certaines de ces structures sont isomorphes à des phrases des langues naturelles. Et au plan des résultats l'ordre de difficulté
trouvé ici avec des phrases artificielles est en parfait accord avec celui qui a pu être trouvé par ailleurs avec des phrases
naturelles. Au demeurant, un modèle simple du sujet, basé sur des opérations de mise en relation et d'inversion, se trouve validé
par les résultats.
Abstract
Summary
In current experiments in psycholinguistics, it is very difficult if not impossible to differentiate the role of syntax from the role of
semantics. In the present experiment, the use of artificial elements that do not convey any particular meaning enables us to study
separately the influence of the formai complexity of the sentence on the processing duration.
The material is composed of embedded structures and passive forms. Some of these structures are isomorphic to natural
language sentences. The results show that durations for processing artificial sentences are ordered in the same fashion as
durations for processing natural sentences. The results validate a model of the subject based on relation operations and inversion
operations.
Citer ce document / Cite this document :
Bovet Pierre, Le Moan J.-P., Segui Juan. Le traitement d'un langage artificiel. In: L'année psychologique. 1977 vol. 77, n°2. pp.
405-415.
doi : 10.3406/psy.1977.28207
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1977_num_77_2_28207de Psychologie expérimentale et comparée'1 Laboratoire
Université Eené-Descartes et E.P.H.E., 3e section
associé au C.N.R.S.
LE TRAITEMENT D'UN LANGAGE ARTIFICIEL
par Pierre Bovet2, Jean-Pierre Le Moan3
et Juan Segui4
SUMMARY
In current experiments in psycholinguistics, it is very difficult if not
impossible to differentiate the role of syntax from the role of semantics.
In the present experiment, the use of artificial elements that do not convey
any particular meaning enables us to study separately the influence of
the formal complexity of the sentence on the processing duration.
The material is composed of embedded structures and passive forms.
Some of these structures are isomorphic to natural language sentences.
The results show that durations for processing artificial sentences are
ordered in the same fashion as durations for processing natural
The results validate a model of the subject based on relation operations
and inversion operations.
INTRODUCTION
La mise en échec de l'hypothèse de correspondance stricte
entre complexité syntaxique et complexité psychologique des
énoncés a suscité ces dernières années une nouvelle ligne de
recherches qui s'efforcent de dégager les stratégies perceptives
employées par les sujets dans des tâches de production et
1. 28, rue Serpente, 75006 Paris.
2. Actuellement au Laboratoire de Psychologie expérimentale, 29, avenue
Robert-Schuman, 13100 Aix.
3. U.E.R. de Mathématiques, Logique formelle et Informatique, 12, rue
Cujas, 75005 Paris.
4. Laboratoire de Psychologie expérimentale et comparée.
L'Année psychologique 2/77, 405-416 P. Bovet, J.-P. Le Moan et J. Segui 406
de compréhension linguistiques (Bever, 1970 ; Amy, 1973 ;
Slobin, 1973 ; Fodor, Bever, et Garret, 1974). Parmi les stratégies
proposées, certaines reposent exclusivement sur la prise en
considération de la structure formelle des énoncés, c'est-à-dire
qu'elles sont tout à fait indépendantes de la signification de
ceux-ci. Au regard de ces stratégies formelles d'analyse, toute
structure syntaxique peut être classée selon le degré de dif
ficulté qu'offre son analyse et la question se pose de savoir
quelles sont les particularités des structures syntaxiques qui
font problème pour l'application de ces stratégies.
Une réponse à cette question a été avancée par Slobin (1973)
qui propose un principe universel selon lequel l'interruption ou
le réarrangement des unités linguistiques pose des problèmes
pour le traitement des énoncés. Sheldon (1974) a reformulé ce
principe sous la forme de l'affirmation empirique suivante :
« Un énoncé avec une interruption ou un réarrangement des
unités linguistiques peut être plus difficile à traiter qu'un énoncé
qui ne contient pas une ou un réarrangement. »
Les unités linguistiques généralement considérées sont les
propositions élémentaires SV(O) ; celles-ci semblent en effet
correspondre aux unités fonctionnelles d'analyse (Fodor, Bever
et Garret, 1974). Dans cette perspective, l'analyse perceptive
de la phrase implique la « récupération » ou le « rétablissement »
des propositions élémentaires sous-jacentes et l'affirmation de
Sheldon établit que cette sera d'autant moins
aisée que : a) les termes d'une même proposition élémentaire ne
sont pas en contiguïté dans la séquence (il y a interruption de
l'unité linguistique), et b) les termes de la
sont disposés dans un ordre autre que l'ordre canonique SV(O)
(il y a réarrangement par rapport à cet ordre canonique). Le
principe de Slobin et l'affirmation de Sheldon sont clairement
liés au fait que le langage est analysé de manière séquentielle,
car ils supposent une réorganisation de la séquence présentée
pour atteindre les unités fonctionnelles qui sous-tendent la per
ception et la compréhension du langage1.
1. Dans certains travaux de psycholinguistique, on a cherché à mesurer
de manière très directe le degré de difficulté lié à la récupération des propos
itions de base selon la structure superficielle de l'énoncé présenté. Ainsi
par exemple Peterfalvi et Locatelli (1971) étudient le temps nécessaire pour
rétablir la relation sujet-objet des propositions de base correspondant à
des énoncés complexes de différentes structures syntaxiques (voir également
Foss et Lynch, 1969). traitement d'un tangage artificiel 407 Le
La question soulevée dans cet article est de savoir si la carac-
térisation des séquences, dérivée du principe de Slobin, ne peut
pas être transposée sur un matériel non linguistique.
L'emploi d'un matériel artificiel permet d'une part de définir
d'une manière explicite les unités d'analyse à considérer, et
d'autre part de faire varier de façon systématique les facteurs
structuraux envisagés.
Les résultats de notre recherche devraient permettre de
déterminer en premier lieu si les facteurs structuraux d'inter
ruption et de rearrangement conditionnent le processus de déco
dage des séquences artificielles, et en second lieu s'ils le font
d'une manière analogue à celle constatée pour le traitement
d'énoncés linguistiques.
Il faut souligner toutefois que bien que les séquences utilisées
dans cette recherche reproduisent — à un certain niveau d'ana
lyse — des structures correspondant à des phrases de la langue
naturelle, nous ne pensons pas que lors de leur traitement ces
séquences soient « assimilées » à des phrases, ni encore que des
stratégies d'analyse syntaxique soient « transférées » d'un matériel
à l'autre. Le point qui nous intéresse est qu'aussi bien pour le tra
itement des séquences linguistiques que pour celui des séquences
artificielles les sujets doivent opérer sur une suite de symboles
afin d'établir des relations définies entre eux. Notre hypothèse
de travail affirme que dans les deux cas l'établissement de ces
relations est conditionné par des contraintes très générales liées
à la structure séquentielle du stimulus. Ces contraintes seront
précisées dans le présent travail à l'aide d'un modèle qui spécifie
et hiérarchise les différentes opérations mises en œuvre pour le
décodage des séquences utilisées.
DESCRIPTION DU LANGAGE ARTIFICIEL
Le matériel est composé de trois classes de symboles :
3 symboles nominaux : J, K, L ;
2 relationnels : ■ (= actif) Q (= passif) ;
1 symbole substituant : — .
A un premier niveau d'organisation, deux symboles nominaux dif
férents et un symbole relationnel placé au milieu sont susceptibles de
former une proposition ; cette proposition une fois décodée peut être
résumée par un couple formé de deux symboles nominaux suivant la
règle : Si le symbole relationnel est actif, l'ordre des symboles dans la 408 P. Bovet, J.-P. Le Moan et J. Segui
proposition est conservé ; s'il est passif, cet ordre est inversé. Dans ce
deuxième cas le décodage implique donc un réarrangement des termes
de la proposition. Le tableau I illustre cette règle.
Tableau I
Proposition Couple
J ■ L JL
JDL LJ
A un deuxième niveau d'organisation, deux propositions (dont la
seconde a pour premier symbole nominal l'un des symboles nominaux
de la première) sont susceptibles de former une séquence. Toute séquence
comporte trois symboles nominaux séparés par deux symboles relation
nels et aussi un symbole substituant qui est situé soit après le premier,
soit après le second symbole nominal. Dans le premier cas, la séquence
est dite « emboîtée » ; dans le deuxième cas, on a une séquence « dérivée ».
Ainsi dans les séquences emboîtées il y a interruption de l'une des pro
positions. Le tableau II illustre cette deuxième règle.
Tableau II
Séquence Propositions Couples
J — BK ■ L J ■ K, J ■ L JK, JL
J ■ K — ■ L L KL JHK, KB
En définitive, on obtient 8 formes de séquences qui peuvent être
caractérisées par le produit de deux facteurs : a) position du symbole
substituant (dérivée (D) et emboîtée (E)), et b) nature des symboles
relationnels (deux actifs (1) ou ■ ■ ; actif suivi de passif (2) ou ■ □ ;
passif suivi d'actif (3) ou □ ■ ; deux passifs (4) ou □ □ ). Le tableau III
donne des exemples de ces 8 formes.
Tableau III
D J BK — BL J IK-QL J DK-|L J □ K— □ L
E J — J — BK DL J-QK BL J — □ K QL
Chacune de ces formes est réalisée par 6 séquences différentes co
rrespondant aux 6 permutations des 3 symboles nominaux. Le traitement d'un langage artificiel 409
C'est donc un ensemble de 48 séquences-stimulus qui constitue notre
langage.
Les réponses demandées aux sujets sont conformes aux deux niveaux
d'organisation décrits ci-dessus. C'est deux couples successifs de symb
oles nominaux qu'ils doivent donner comme preuve de leur compréhens
ion de chaque séquence. Le tableau IV donne les réponses correspon
dant aux 8 exemples de formes du tableau III.
Tableau IV
Séquences Réponses
J- -■K L JK, JL L LJ — n ■ J- -D K L KJ, JL -DK L LJ n
J ■ K L JK, KL — n ■ J ■ K L LK
J IHK L KJ, KL
— D J DK L LK
HYPOTHESES SUR LE MODE DE TRAITEMENT DES SEQUENCES
a) Le traitement des séquences n'est pas réalisé de façon globale,
mais de proche en proche.
b) L'exploration successive des symboles est orientée de gauche à
droite.
c) Le stockage de l'information se fait préférentiellement sous la
forme de « couples » de symboles nominaux, de façon telle que l'unité
de traitement est isomorphe à l'unité de réponse.
Les couples des symboles nominaux (unités de traitement) résultent
du décodage de la séquence ; c'est-à-dire que l'ordre des éléments du
couple sera identique à l'ordre de présentation de ses éléments quand le
symbole relationnel est actif, mais cet ordre sera inverse à l'ordre de
présentation quand le symbole relationnel est passif.
d) La capacité de la mémoire immédiate des sujets étant limitée,
ceux-ci seront contraints de réexplorer la séquence quand l'information
nécessaire à certaines mises en relation est floue ou inexistante en
mémoire.
PRÉVISIONS RELATIVES A LA DURÉE DE DÉCODAGE
DES SÉQUENCES EXPÉRIMENTALES
1) Toute mise en relation entre des éléments non contigus d'une
séquence prend plus de temps qu'une mise en relation analogue entre
des éléments contigus (cf. hypothèse a) et d)). Nous parlons en ce cas
du rôle du facteur d'interruption. P. Bovet, J.-P. Le Moan et J. Segui 410
Ceci conduit à prévoir que, toutes choses étant égales par ailleurs,
les séquences E seront plus longues à décoder que les séquences D.
2) Toute mise en relation entre les éléments d'une proposition passive
prend plus de temps qu'une mise en relation analogue entre les éléments
d'une proposition active (cf. hypothèses b) et c)). Il s'agit là du rôle
du facteur de réarrangement.
Ceci conduit à prévoir que les séquences ne comportant pas de
symbole relationnel passif seront plus rapidement décodées que celles
comportant un ou deux de ces symboles. Par ailleurs, on peut s'attendre
à ce que les séquences comportant deux symboles passifs soient plus
longues à décoder que celles qui n'en comportent qu'un.
3) Lorsque le symbole relationnel passif relie les deux premiers
symboles nominaux de la séquence, le temps de décodage sera plus
long que dans le cas où ce symbole relie les derniers symboles nominaux
de la séquence. En effet, dans le premier cas le sujet peut être amené,
pour achever son décodage, à contrôler les positions effectives des pre
miers symboles sur lesquels a porté une opération d'inversion et ceci
en raison de la difficulté d'identifier l'élément du premier couple cons
titué qui doit être repris pour là suite du décodage (cf. hypothèses c)
et d)). Ceci conduit à prévoir que, parmi les séquences ne comportant
qu'un seul symbole relationnel passif, celles où ce symbole est placé
en premier seront plus longues à décoder que celles où ce symbole
est placé en deuxième.
PROCÉDURE EXPÉRIMENTALE
Le matériel est composé de 48 séquences-stimulus. Chacune des
8 formes de séquence est représentée par 6 exemplaires obtenus par
permutation des 3 symboles nominaux JKL.
Les stimulus sont présentés en une suite aléatoire1 sur l'écran de
visualisation d'un ordinateur PDP 12 qui contrôle complètement l'expé
rimentation2. Chaque stimulus s'inscrit dans une surface de 8 cm de
large sur 1 cm de haut, le sujet étant placé à 50 cm de l'écran.
La tâche du sujet consiste à décoder le plus rapidement possible le
stimulus sous la forme de deux couples de symboles constituant la
réponse. Ces couples doivent être frappés au clavier d'un télétype.
Cependant, avant de frapper ces couples-réponse, le sujet doit appuyer
sur une touche spéciale (barre du clavier) pour indiquer que sa réponse
1. Cette suite est générée par l'ordinateur au cours même de la passation
en raison de la nécessité de « remise » des stimulus dont le temps de décodage
n'a pas été relevé (cf. infra).
2. L'expérience a été conduite au Centre d'Etudes des Processus cogni-
tifs et du Langage (Paris) en 1972. traitement d'un langage artificiel 411 Le
est prête. Cet appui entraîne la disparition du stimulus. Le sujet dispose
alors de 3 s pour la frappe des 4 lettres constituant sa réponse. Le stimulus
suivant apparaît 3 s après la frappe de la dernière de ces lettres.
Le temps de réponse pris en considération est celui qui sépare l'appa
rition du stimulus de l'appui sur la barre. Cette méthode permet de
distinguer le temps même de décodage de celui de frappe de la réponse.
Une certaine variabilité liée à la complexité de la réponse motrice est
ainsi évitée.
On notera que la brièveté du délai imparti à la frappe de la réponse
empêche que le décodage du stimulus puisse être effectué ou simple
ment achevé lors de cette frappe.
Dans le cas où la réponse correcte à un certain stimulus n'a pas été
frappée par le sujet dans un délai de 3 s après l'appui de la barre (cas
de réponse erronée ou cas d'une frappe trop lente)1, cette séquence-
stimulus est représentée par la suite avec une probabilité égale à celles
des séquences non encore présentées.
Une séance expérimentale est automatiquement achevée lorsque
chacune de 48 séquences-stimulus a donné lieu à une réponse correcte,
c'est-à-dire lorsqu'à chaque stimulus peut être associé un temps de
décodage.
Dix sujets adultes, tous rompus aux exigences des situations de
laboratoire, ont passé l'expérience. Après avoir été entraînés à appliquer
les règles de décodage de notre matériel, chaque sujet subit deux séances
expérimentales complètes séparées par un intervalle d'une vingtaine de
minutes.
La première séance est destinée à familiariser le sujet avec la tâche
et à éliminer l'effet d'apprentissage lors de la présentation suivante
qui, seule, est analysée.
RÉSULTATS
Remarquons tout d'abord que le nombre d'erreurs (réponse
fausse ou frappe trop lente) subsistant dans la phase expériment
ale proprement dite est très faible : inférieur à 6 % des pré
sentations2. Ce fait justifie l'utilisation du temps de réponse en
tant qu'indicateur de la difficulté de décodage.
Le tableau V présente les temps moyens de réponses pour les
1. Les cas, tout à fait exceptionnels, où le sujet n'a pas appuyé sur la
barre dans les 40 s qui suivent la présentation du stimulus se rangent éga
lement ici.
2. Au demeurant, le nombre des erreurs analysées selon le type de
séquence est parfaitement corrélé avec la durée moyenne de décodage cor
rect de ces mêmes réponses. 412 P. Bovet, J.-P. Le Moan et J. Segui
8 formes de séquences stimulus utilisées. Ces formes sont classées
selon le croisement de nos deux facteurs : position du symbole
substituant (D et E) et nature des relationnels (1, 2, 3, 4).
Tableau V
D 2,99 3,22 3,90 3,95 3,52
E 3,37 3,89 4,62 4,21 4,02
m 3,18 3,56 4,26 4,08 3,77
(A chacune des cases centrales correspondent 60 mesures.)
Une analyse de la variance met en évidence, au niveau
global, les effets suivants :
a) Les séquences E sont plus longues à décoder que les
séquences D (a < 0,0005).
b) la nature des symboles relationnels introduit des diff
érences dans le temps de décodage (a < 0,0005).
Ces résultats sont en accord avec les prévisions que nous
avons présentées plus haut. La différence entre E et D est
observée, quelle que soit la nature des symboles relationnels
(absence d'interaction significative entre nos deux facteurs) et
ce résultat confirme la prévision 1 .
Les séquences ne comportant pas de symbole relationnel
passif sont plus rapidement décodées que celles qui comportent
de tels symboles (comparaison 1 vs 2, 3, 4 significative à 0,0005).
Ce résultat confirme la prévision 2.
Toutefois, les séquences comportant deux symboles relation
nels passifs ne sont pas significativement plus longues à décoder
que celles qui n'en comportent qu'un. La comparaison part
ielle 2, 3 vs 4 est non significative. Au niveau des séquences à
un seul symbole relationnel passif, celles pour lesquelles ce
symbole est placé en première position sont plus longues à
décoder que celles où il est en seconde place (comparaison part
ielle 2 vs 3 significative à 0,0005). Ceci confirme la prévision 3.
Les deux comparaisons partielles ci-dessus 1 vs 2, 3, 4 et
2 vs 3 montrent que l'effet de la nature du symbole relationnel
est comparable, quelle que soit la place du substituant ;
en effet, dans les deux cas, l'interaction de nos deux facteurs
n'est pas significative. Pour la comparaison partielle 2, 3 vs 4, Le traitement d'un langage artificiel 413
on observe une interaction significative au seuil de 0,01. L'in
fluence de la présence d'un deuxième symbole relationnel passif
sur le temps de décodage n'est pas la même pour les deux types
de structures considérés. Pour les structures D, la présence
d'un deuxième symbole passif conduit effectivement à un allo
ngement du temps de décodage, mais il n'en est pas de même pour
les séquences E.
Il est nécessaire de signaler ici que les temps de décodage
des formes comportant deux symboles relationnels passifs (c'est-à-
dire E-4 et D-4) présentent une forte variabilité intra et inter
individuelle1. En revanche, les analyses des données individuelles
révèlent la généralité des résultats correspondant aux formes
ayant 0 ou 1 symbole passif.
DISCUSSION
Notre recherche montre qu'il est possible de faire des pré
visions correctes sur le temps de décodage d'une séquence de
symboles artificiels par la prise en considération des opérations
élémentaires impliquées dans ce processus. Les caractéristiques
de ces opérations (opérations d'inversion et de mise en relation)
et leur complexité relative ont été précisées à l'aide d'un modèle
hypothétique concernant le mode de traitement des séquences
par le sujet.
Les principaux résultats obtenus confirment d'une part que,
toutes choses étant égales par ailleurs, les structures dérivées
sont plus rapidement décodées que les enchâssées
et que, d'autre part, toute opération de mise en relation accompag
née d'une inversion implique un temps de décodage supérieur
à une mise en relation directe analogue.
L'intérêt de tels résultats, obtenus à partir d'un matériel
artificiel, est qu'ils montrent d'une manière précise que cer
taines des variables structurelles auxquelles font référence les
recherches de psycholinguistique, notamment le rearrangement
1. Certains commentaires de nos sujets après l'expérience, nous ont
conduits à faire l'hypothèse que la variabilité des résultats obtenus pour ces
séquences résulte de l'emploi éventuel de stratégies autres que celle pos
tulée par notre modèle général (c'est-à-dire stratégie séquentielle orientée
de gauche à droite). Le but de ces stratégies particulières de décodage semble
bien être d'éviter l'emploi des opérations d'inversion entre les termes
perçus.

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.