Effets de la prosodie sur la résolution syntaxique de la parole comprimée - article ; n°1 ; vol.80, pg 33-50

De
Publié par

L'année psychologique - Année 1980 - Volume 80 - Numéro 1 - Pages 33-50
Résumé
Une expérience comparant des énoncés français et anglais entendus avec une intonation normale ou avec une prosodie en conflit avec la structure syntaxique sous-jacente montre que, lorsque la compression de la parole augmente, l'intelligibilité décroît. Aux taux élevés de compression, les phrases entendues avec une intonation normale résistent significativement mieux que celles entendues avec une intonation anormale. Une analyse des erreurs suggère que le traitement de l'intonation est une étape critique dans le traitement perceptif de la parole, dont la fonction est de fournir, dans les deux langues, des indices supplémentaires pour déterminer la structure syntaxique.
Summary
Results of an experiment compare intelligibility of time-compressed French and English sentences heard either in normal intonation, or with prosodic patterns conflicting with underlying syntactic structure. For both languages, an overall decrement in intelligibility with increasing compression is observed with similar slope and, at higher compression ratios, sentences heard in normal intonation are better able to withstand the debilitating effects of time-compression than those heard in anomalous intonation. Subjects' errors suggest that intonation normally operates in both languages to supply supplemental eues for determining syntactie structure as a critical step in the perceptual processing of heard speech.
18 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : mardi 1 janvier 1980
Lecture(s) : 23
Nombre de pages : 19
Voir plus Voir moins

J. Buttet
A. Wingfield
A. W. Sandoval
Effets de la prosodie sur la résolution syntaxique de la parole
comprimée
In: L'année psychologique. 1980 vol. 80, n°1. pp. 33-50.
Résumé
Une expérience comparant des énoncés français et anglais entendus avec une intonation normale ou avec une prosodie en
conflit avec la structure syntaxique sous-jacente montre que, lorsque la compression de la parole augmente, l'intelligibilité
décroît. Aux taux élevés de compression, les phrases entendues avec une intonation normale résistent significativement mieux
que celles entendues avec une intonation anormale. Une analyse des erreurs suggère que le traitement de l'intonation est une
étape critique dans le traitement perceptif de la parole, dont la fonction est de fournir, dans les deux langues, des indices
supplémentaires pour déterminer la structure syntaxique.
Abstract
Summary
Results of an experiment compare intelligibility of time-compressed French and English sentences heard either in normal
intonation, or with prosodic patterns conflicting with underlying syntactic structure. For both languages, an overall decrement in
intelligibility with increasing compression is observed with similar slope and, at higher compression ratios, sentences heard in
normal intonation are better able to withstand the debilitating effects of time-compression than those heard in anomalous
intonation. Subjects' errors suggest that intonation normally operates in both languages to supply supplemental eues for
determining syntactie structure as a critical step in the perceptual processing of heard speech.
Citer ce document / Cite this document :
Buttet J., Wingfield A., W. Sandoval A. Effets de la prosodie sur la résolution syntaxique de la parole comprimée. In: L'année
psychologique. 1980 vol. 80, n°1. pp. 33-50.
doi : 10.3406/psy.1980.28301
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1980_num_80_1_28301L'Année Psychologique, 1980, 80, 33-50
Centre de Neuropsychologie, CHUV, Lausanne, Suisse
Department of Psychology, Brandeis University,
Waliham, Massachusetts, USA
EFFETS DE LA PROSODIE
SUR LA RÉSOLUTION SYNTAXIQUE
DE LA PAROLE COMPRIMÉE1
par Jocelyne Buttet2,
Arthur Wingfield et Anne W. Sandoval3
SUMMARY
Results of an experiment compare intelligibility of time-compressed
French and English sentences heard either in normal intonation, or with
prosodie patterns conflicting with underlying syntactic structure. For both
languages, an overall decrement in intelligibility with increasing compress
ion is observed with similar slope and, at higher compression ratios, sen
tences heard in normal intonation are better able to withstand the debili
tating effects of time-compression than those heard in anomalous intonat
ion. Subjects' errors suggest that intonation normally operates in both
languages to supply supplemental cues for determining syntactic structure
as a critical step in the perceptual processing of heard speech.
INTRODUCTION
L'impact de la théorie linguistique de Chomsky (1957, 1965)
sur l'étude expérimentale de la perception et de la production
de la parole ne peut être sous-estimé. Alors qu'on a cru au début
1. Cette recherche a été réalisée dans le cadre de la requête n° 3874-0.77
du Fonds national suisse de la Recherche scientifique et grâce à une bourse
délivrée par ce même Fonds au premier auteur et une bourse des National
Institutes of Health (phs Grant ns-14662, USA) accordée au second
auteur. Nous tenons à remercier J. Grimshaw et R. Jolivet pour leurs
conseils dans l'étude linguistique ainsi que P. Léon et Ph. Martin qui noua
ont permis de réaliser des analyses oscillographiques de nos enregistrements
dans leur laboratoire de phonétique à Toronto.
2. CHUv, Lausanne.
3. Brandeis University. 34 Jocelyne Bullel
que l'analyse de la phrase était réalisée mot à mot, sur une
base séquentielle, on s'est ensuite aperçu, par exemple, que
la perception de la phrase représentait une opération dynamique,
largement, si ce n'est entièrement, guidée par la structure syn
taxique et les relations sémantiques que de telles structures
représentent. Il en découle que les frontières des propositions
à l'intérieur des phrases jouent un rôle essentiel dans l'organi
sation perceptive, en marquant les des unités per
ceptives par lesquelles les phrases sont analysées (Fodor, Bever
et Garrett, 1974, p. 329).
Pour prouver l'existence d'une segmentation syntaxique de
la parole continue on s'est basé en bonne partie sur un para
digme, prometteur au départ, qui fut introduit par Ladefoged
et Broadbent (1960) et repris par Fodor et Bever (1965), Garrett,
Bever et Fodor (1966), Bever, Lackner et Kirk (1969) et d'autres.
Quand un son bref — ou « clic » — est surimposé à de la parole
enregistrée, les sujets fournissent en général des réponses plus
précises sur la localisation lorsque le clic est présenté à une
frontière syntaxique majeure que quand il est situé à l'intérieur
des constituants syntaxiques. Dans ce dernier cas, les erreurs
tendent à montrer que le clic a « émigré » subjectivement vers
la frontière syntaxique la plus proche. De tels résultats ont été
généralement interprétés comme étant le reflet d'une intégrité
perceptive des constituants qui résistent à la rupture provoquée
par un son extérieur.
Bien que l'idée de base selon laquelle la résolution syntaxique
joue un rôle clé dans le traitement de la phrase n'ait pas été
contestée, les études sur le clic, elles, ont été mises en question.
Il y a au moins un effet mnésique partiel dans les résultats
(Wingfield et Klein, 1971) et il est difficile de dire si les données
obtenues reflètent véritablement une segmentation perceptive
ou des stratégies attentionnelles de la part des auditeurs ou
encore des biais dans les réponses lors de l'évocation (Ber-
telson, 1972 ; Bever, 1972 ; Ladefoged, 1967 ; Reber, 1973).
Une autre faiblesse de ces premières études est de n'avoir pas
ténu compte des traits prosodiques (contour d'intonation, accent
et rythme) dans le traitement syntaxique, ou d'en avoir minimisé
l'importance (par exemple Garrett, Bever et Fodor, 1966). Uti
lisant une méthode semblable à celle de Garrett et coll., Wingfield
et Klein (1971) ont enregistré des phrases qu'ils ont ensuite
coupées et montées afin d'obtenir de la parole dans laquelle la prosodie et la résolution syntaxique 35 La
structure syntaxique et la prosodie étaient en conflit direct.
Les résultats ont montré que les sujets avaient une forte tendance
à organiser leurs réponses en constituants marqués autant par
les indices prosodiques que par la structure syntaxique formelle
déterminée seulement par le contenu lexical. D'autres études
ont, par la suite, confirmé le rôle important de l'intonation et
du rythme dans la résolution syntaxique de la parole en tant que
partie intégrante de son traitement perceptif actif (Darwin, 1975 ;
Geers, 1978 ; Wingfield, 1975 a). Bien que les études citées ci-
dessus aient été réalisées en anglais, il n'y a aucune raison de
s'attendre à ce que les traits prosodiques jouent un rôle moins
important en français (par exemple Grosjean et Deschamps, 1975 ;
Martin, 1975 ; Rossi, 1977).
Gomme d'autres sources potentielles d'information supplé
mentaire, le rôle de la prosodie dans la perception de la parole
peut facilement passer inaperçu dans des conditions d'écoute
ordinaires. Une façon de révéler son influence est d'examiner son
rôle dans des conditions d'écoute plus difficiles, soit avec un signal
dégradé. La parole artificiellement accélérée, ou « comprimée
dans le temps », peut être utile à cet égard puisque le taux des
mots peut être augmenté par paliers contrôlés jusqu'à des limites
tolérables, et au-delà, tout en conservant essentiellement intacts
le scheme temporel relatif de la parole et des périodes de silence,
l'accentuation des mots et l'intonation (Foulke, 1971).
Avec de l'anglais comprimé, Wingfîeld (1975 a) a montré
que la parole résistait mieux aux effets débilitants de la compress
ion lorsqu'elle était accompagnée d'une prosodie appropriée ;
il en a déduit que le rôle de celle-ci était d'aider les auditeurs
dans la résolution syntaxique de la parole rapide au moyen d'une
redondance ajoutée au signal de parole.
La généralité de ces premiers résultats est importante non
seulement pour une théorie linguistique mais aussi pour les
études des asymétries hémisphériques corticales dans l'analyse
de la syntaxe et de l'intonation (Zurif, 1974) et les études expé
rimentales de la reconnaissance de la parole. C'est pourquoi
nous avons étendu l'étude à des sujets francophones et rappor
tons ici les résultats des deux expériences afin d'examiner quelle
est la portée générale de ces données et dans quelle mesure leur
analyse est appropriée à l'étude du rôle des traits prosodiques
du français parlé. 36 Jocelyne Buttet
MATÉRIEL ET MÉTHODE
Phrases slimulus
L'expérience est constituée d'une série de phrases françaises enten
dues soit avec une intonation normale, soit avec un scheme prosodique
approprié à une phrase de structure syntaxique différente. Sept types
différents de phrases, d'usage courant, ont été choisis. La même tech
nique de montage que celle décrite par Wingfield (1975 a) a été utilisée.
Dans cette méthode, les paires de phrases ont été construites de sorte
qu'elles aient en commun des séquences identiques de 3 à 7 mots, mais
dans lesquelles le contexte linguistique environnant place la frontière
syntaxique majeure à différents endroits à l'intérieur de la séquence.
Un exemple d'une paire de chaque type est donné ci-dessous, avec la
séquence de mots communs écrits en italique et une virgule indiquant
les frontières syntaxiques majeures.
Type I : la frontière syntaxique majeure apparaît soit après un
verbe à la forme infinitive, soit après un verbe infinitif transitif suivi
d'un complément d'objet direct.
Ex. : (1) En oubliant d'appeler, Pierre a commis une mauvaise action.
(2) En d'appeler Pierre, tu as une faute.
Type II : la frontière syntaxique majeure apparaît soit après un
complément d'objet direct suivant un verbe transitif, soit entre un
verbe transitif et un substantif sujet de la proposition suivante.
Ex. : (1) Quand je peins Marie, tu peux nous rendre visite.
(2) je peins, Marie vient souvent me regarder travailler.
Type III : la frontière se situe soit entre une préposition ou un
adverbe et un nom (ou pronom), soit après un nom ou pronom suivant
une préposition.
Ex. : (1) Tu n'étais pas heureux avant, l'arrivée de tes amis a transformé
ton existence.
(2) Tu étais heureux avant l'arrivée de tes amis, mais ils ont bou
leversé tes habitudes.
Type IV : la frontière syntaxique majeure apparaît après un adjectif
ou avant un participe se rapportant au même sujet dans les deux
phrases de chaque paire.
Ex. : (1) Vous avez entendu votre ami agacé, répondre vertement à son
interlocuteur.
(2) Vous avez entendu votre ami, agacé par la suffisance de son
partenaire. La prosodie et la résolution syntaxique 37
Type V : phrases de structure similaire au type IV mais où l'adjectif
ou le participe se rapporte à deux noms différents selon le contexte de
chaque membre de la paire.
Ex. : (1) Elle a aimé le rôle de Vhéroïne passionnée, mais pas son inter
prétation.
(2) Elle aimerait jouer le rôle de Vhéroïne, passionnée par son
personnage énigmatique.
Type VI : la frontière syntaxique majeure apparaît avant ou après
une proposition contenant un nom + un complément du nom ou entre
deux noms ou entre une préposition et un nom.
Ex. : (1) II ne manque jamais cette émission des jeunes, le mercredi
matin.
(2) Pour créer cette émission, des jeunes sont descendus dans la rue.
Type VII : la frontière apparaît soit entre un nom et un adjectif
(ou adjectif et nom), soit après un nom suivant un adjectif (ou un
adjectif suivant un nom).
Ex. : (1) Pierre est un ami français, que j'ai connu en Amérique.
(2) est un ami, français de cœur mais américain d'origine.
Les phrases ont tout d'abord été enregistrées avec une intonation
normale, c'est-à-dire de manière naturelle, par une locutrice de langue
maternelle suisse-française. A partir de chaque paire, deux nouvelles
phrases ont été alors construites en croisant les segments de bande
comportant les séquences de mots communs de chaque phrase : ainsi,
chaque séquence placée dans le contexte de l'autre phrase de la paire
a donné lieu à une paire supplémentaire de phrases dans lesquelles les
traits prosodiques normalement associés à la structure de la phrase ne
coïncidaient plus avec leur frontière syntaxique majeure. La (1)
du type I était alors entendue avec une intonation correspondant à
une frontière entre les mots Pierre et tu, tandis que la phrase (2) était
entendue avec une intonation appropriée à une frontière apparaissant
entre appeler et Pierre.
Des enregistrements visuels de ces phrases peuvent être obtenus
au moyen d'un analyseur de mélodie tel celui décrit par Léon et
Martin (1969). La figure 1 illustre les exemples ci-dessus. Les parties
supérieure et moyenne de la figure représentent l'intensité (dB) et le
contour d'intonation (Fo) en fonction du temps pour les phrases (1)
et (2) enregistrées à l'origine avec une intonation normale. La partie
inférieure montre comment le résultat de notre croisement produit
un changement du contour général de hauteur allant de pair avec un
déplacement notable de la pause associée à l'origine avec la frontière
syntaxique majeure entre appeler et Pierre. :
Jocelyne Buitel 38
'hroje 1.' Intonation Normal*
iâu Ik
En oubliant d'oppeltr •
dB
350
300
I? 250
200
>hrat* 2. ■ Intonation Normal*
|* i»M — -• JP W ' p 'P
En oubliant d'oppeltr Plan* i tu ai commit un* faut*. f dB
iy Vvaa- f
350 L ; t'* * j, 300
250 * 200 i\
■brate 1. ' Intonation Anormol* '
En oubliant d'appeler .- ;
dB
350
300
250
200
Fig. 1. ' — Représentation visuelle d'une paire de phrases enregistrées
avec une intonation normale : déroulement dans le temps de l'intensité (dB)
et du contour d'intonation (Fo).
La partie inférieure reproduit une nouvelle version de la phrase 1 obtenue
par croisement des phrases 1 et 2, avec un conflit entre la structure syn
taxique et le scheme prosodique normal d'accompagnement.
Un total de 36 paires de phrases dites avec une intonation normale
et de 36 paires avec intonation anormale a été construit de cette manière.
La longueur des phrases utilisées varie de 9 à 15 mots et la
vitesse moyenne est de 187 mots par minute. Les frontières syntaxiques
majeures apparaissent entre le troisième et le douzième mot afin de
minimiser toute possibilité d'influence de la position sérielle. Le mon
tage a été fait soigneusement de sorte qu'il est silencieux et passe ina
perçu lors de l'écoute. La prosodie et la résolution syntaxique 39
Compression de la parole
Tout le matériel précédemment décrit a été électroniquement
comprimé dans le temps au moyen de la méthode de compression dite
d' « échantillonnage » sur un appareil Lexicon Varispeech II Compressor/
Expander. Cette méthode supprime périodiquement de petits segments
de bande (20 ms) à des intervalles réguliers et ensuite met bout à
bout les segments restants. Le résultat obtenu, quand on passe la
bande à vitesse normale, est une parole reproduite en moins de
temps que le temps normal, mais sans les distorsions de hauteur ou
de qualité que l'on produirait en faisant fonctionner le magnétophone
à une vitesse trop rapide par exemple. Le degré de compression est
contrôlé par la fréquence avec laquelle les segments de bande sont
effacés.
L'ensemble des phrases, tant avec intonation normale qu'anormale,
a été comprimé à 80, 70, 60, 50 et 40 % du temps normal de production,
ce qui correspond à des taux de parole d'approximativement 234,
268, 312, 375 et 468 mots/minute.
Procédure
Les sujets étaient prévenus qu'ils allaient entendre une série de
courts énoncés français enregistrés à différentes vitesses : la consigne
était d'écouter attentivement chaque énoncé et, aussitôt après, de le
reproduire par écrit aussi précisément que possible. Bien que le principe
de la compression dans le temps leur ait été expliqué, aucune mention
particulière n'a été faite concernant les différents types de phrases ou
l'intonation anormale.
Chaque sujet a entendu un total de 36 phrases, 6 à la vitesse normale
de 187 mots/minute et 6 à chacun des 5 taux de compression décrits.
L'ordre de présentation des différentes compressions, de même que
l'ordre des phrases particulières entendues à chaque vitesse de parole
variaient systématiquement d'un sujet à l'autre. La moitié des phrases
à chaque vitesse a été présentée avec une intonation normale et la
moitié avec une intonation anormale. Aucun sujet n'a entendu la même
phrase plus d'une fois, mais sur l'ensemble des sujets, toutes les phrases
ont été entendues un nombre égal de fois avec les deux types d'intonat
ion et à tous les taux de compression.
Le matériel était présenté binauralement avec un magnétophone
Revox A 700 et un casque de bonne qualité, à un niveau moyen de
pression du son de 70 dB (re : 0,0002 dynes/cm2).
Les sujets étaient des étudiants en médecine ou des élèves infirmiers
du chuv de Lausanne (7 femmes et 5 hommes). L'âge moyen était de
21,9 ans. Tous parlaient le français comme première langue ; signalons
toutefois que deux sujets étaient bilingues (français/allemand). 40 Jocelyne Bullet
RESULTATS
Notation
Les scores d'intelligibilité sont basés sur le nombre moyen
de mots rapportés correctement dans chaque phrase ; sont
comptés comme justes tous les mots corrects, sans tenir compte
de l'ordre, et tous les homophones des stimulus présentés (par
exemple mari pour Marie, affaires pour à faire, etc.). L'adjonct
ion, dans la réponse, de mots non présents dans l'énoncé original
n'abaissait pas le score, mais toute modification du mot {man
geant pour manger ou mangé pour mangeant, par exemple) entraî
nait la perte de tout le mot.
Intelligibilité
Les principaux résultats sont résumés sur la figure 2 où l'on
voit les scores moyens d'intelligibilité pour les phrases françaises
entendues avec intonation normale et anormale. A des fins de
comparaison, cette même figure montre aussi les données équi
valentes pour les phrases anglaises, testées et analysées selon
des procédés semblables. Ces résultats sont empruntés à Wing-
field (1975 a). On voit un nombre de similarités importantes
entre les performances dans les deux langues en ce qui concerne
les effets de l'intonation et de la compression dans le temps. Les
scores globaux d'intelligibilité plus élevés pour le français ne
devraient pas masquer ces ressemblances puisque les deux études
comportent des locuteurs et des sujets différents d'une part et
portent sur deux langues différentes d'autre part.
Dans les deux cas, les phrases entendues avec intonation
normale montrent une plus grande résistance aux effets de
compression que celles entendues avec intonation anormale.
Pour le français, une analyse de variance confirme l'effet signi
ficatif de l'intonation (F = 13,53 ; df = 1,11 ; p< 0,005) et
de la baisse générale avec la compression (F = 55,82 ; df = 5,55 ;
p < 0,001 )4. De tels résultats avaient aussi été trouvés en anglais,
4. L'analyse des données individuelles pour les deux sujets bilingues a
montré que leurs résultats étaient en tous points comparables à ceux des
autres sujets. La prosodie el la résolution syntaxique 41
avec un eiïet significatif de l'intonation (F = 21,71 ; df = 1,9 ;
p < 0,005) et de la compression (F = 76,36 ; df = 5,45 ;
p< 0,001).
La seule différence majeure entre les deux ensembles de
données est l'apparition d'une interaction Intonation x Compres-
IOO
90
80
70
60
50
40
\ Français • o Intonation intonation AnormaleNormale\ v v. 30
\ 20 Anglais \
v Intonation Normale \ 10 v Anormale
\
0
200 250 300 350 400 450 500
Taux De Parole (Mots Par Minute)
Fig. 2. — Influence du taux de compression de la parole
sur l'intelligibilité des phrases anglaises et françaises
entendues avec une intonation normale et anormale
sion significative pour les énoncés français (F = 3,76 ; df = 5,55 ;
p < 0,01) reflétant un effet de l'intonation sur l'intelligibilité
seulement aux taux de parole les plus élevés, où la tâche per
ceptive commence à devenir difficile. Cette tendance s'observait
aussi pour l'anglais, bien que l'interaction n'atteignît pas la
signification (F = 2,26 ; df = 5,45 ; n.s.). La similarité frap
pante des pentes des fonctions pour l'anglais et le français,
cependant, suggère qu'une interaction comparable aurait bien

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.