Reconnaissance de la parole et indices de segmentation métriques et phonotactiques - article ; n°1 ; vol.97, pg 77-112
38 pages
Français

Reconnaissance de la parole et indices de segmentation métriques et phonotactiques - article ; n°1 ; vol.97, pg 77-112

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
38 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

L'année psychologique - Année 1997 - Volume 97 - Numéro 1 - Pages 77-112
Summary: Cooperation and conflict between metrical cues and phonotactic cues in speech segmentation.
Three experiments are reported concerning the relative contributions of metrical and phonotactic segmentation cues to listeners' word recognition in French. Listeners had to detect monosyllabic words embedded at the initial position in nonsense bisyllabic strings that were realized as an iambe, typical in French for bisyllabic words, a trochee, or a spondee. Experiment 1 extended the effect of metrical eues to the sequences with two non-coarticulated consonants in the medial position. Word detection was faster for a trochaic pattern than for either an iambic pattern or a neutral spondee. Comparing the effects of cooperating cues and of conflicting cues on detection times, Experiment 2 found neither interference nor interaction between the phonotactic and prosodie speech dimensions, but a redundancy gain in the trochaic condition for both phonotactic conditions. A control experiment studied the recognition of words extracted from the bisyllabic sequences. It showed no effect of previous context on word recognition. These results are discussed in terms of timing mechanisms that may operate either at the level of syllable perception, or as the basis of a prosodic parsing routine. They indicate that phonotactic and metrical cues are processed separately.
Key words : speech perception, lexical parsing, speech segmentation, phonotactic cues, metrical eues.
Résumé
Trois expériences étudient les contributions relatives d'indices de segmentation métriques et phonotactiques à la reconnaissance des mots. La tâche consistait à détecter un mot monosyllabique situé au début d'une séquence bisyllabique sans signification, dont la structure métrique était celle d'un iambe (bref-long, structure usuelle des bisyllabes), d'un trochée (long-bref) ou d'un spondée (long-long). L'effet facilitateur du pattern trochaïque se produit même lorsque la structure phonotactique impose une segmentation, la consonne finale du mot ne pouvant être coarticulée avec le phonème suivant (expérience 1). Lorsque sont confrontés indices phonotactiques (discontinuité sylla-biquelliaison) et métriques (expérience 2), on constate à nouveau un gain en présence d'un trochée, mais pas d'interaction entre les deux dimensions étudiées. Quand les mots sont extraits des suites sans signification (expérience 3), leur contexte d'origine n'a pas d'effet sur leur reconnaissance. Les résultats sont discutés en référence aux mécanismes de traitement de la temporalité à l'œuvre dans la reconnaissance de la parole. On en conclut à un traitement séparé des informations structurales et prosodiques.
Mots-clés : perception de la parole, segmentation lexicale, indices phonotactiques, indices métriques.
36 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Informations

Publié par
Publié le 01 janvier 1997
Nombre de lectures 51
Langue Français
Poids de l'ouvrage 2 Mo

Extrait

M.-H. Banel
N. Bacri
Reconnaissance de la parole et indices de segmentation
métriques et phonotactiques
In: L'année psychologique. 1997 vol. 97, n°1. pp. 77-112.
Citer ce document / Cite this document :
Banel M.-H., Bacri N. Reconnaissance de la parole et indices de segmentation métriques et phonotactiques. In: L'année
psychologique. 1997 vol. 97, n°1. pp. 77-112.
doi : 10.3406/psy.1997.28937
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1997_num_97_1_28937Abstract
Summary: Cooperation and conflict between metrical cues and phonotactic cues in speech
segmentation.
Three experiments are reported concerning the relative contributions of metrical and phonotactic
segmentation cues to listeners' word recognition in French. Listeners had to detect monosyllabic words
embedded at the initial position in nonsense bisyllabic strings that were realized as an iambe, typical in
French for bisyllabic words, a trochee, or a spondee. Experiment 1 extended the effect of metrical eues
to the sequences with two non-coarticulated consonants in the medial position. Word detection was
faster for a trochaic pattern than for either an iambic pattern or a neutral spondee. Comparing the
effects of cooperating cues and of conflicting cues on detection times, Experiment 2 found neither
interference nor interaction between the phonotactic and prosodie speech dimensions, but a
redundancy gain in the trochaic condition for both conditions. A control experiment studied
the recognition of words extracted from the bisyllabic sequences. It showed no effect of previous context
on word recognition. These results are discussed in terms of timing mechanisms that may operate
either at the level of syllable perception, or as the basis of a prosodic parsing routine. They indicate that
phonotactic and metrical cues are processed separately.
Key words : speech perception, lexical parsing, speech segmentation, phonotactic cues, metrical eues.
Résumé
Trois expériences étudient les contributions relatives d'indices de segmentation métriques et
phonotactiques à la reconnaissance des mots. La tâche consistait à détecter un mot monosyllabique
situé au début d'une séquence bisyllabique sans signification, dont la structure métrique était celle d'un
iambe (bref-long, structure usuelle des bisyllabes), d'un trochée (long-bref) ou d'un spondée (long-long).
L'effet facilitateur du pattern trochaïque se produit même lorsque la structure phonotactique impose une
segmentation, la consonne finale du mot ne pouvant être coarticulée avec le phonème suivant
(expérience 1). Lorsque sont confrontés indices phonotactiques (discontinuité sylla-biquelliaison) et
métriques (expérience 2), on constate à nouveau un gain en présence d'un trochée, mais pas
d'interaction entre les deux dimensions étudiées. Quand les mots sont extraits des suites sans
signification (expérience 3), leur contexte d'origine n'a pas d'effet sur leur reconnaissance. Les résultats
sont discutés en référence aux mécanismes de traitement de la temporalité à l'œuvre dans la
reconnaissance de la parole. On en conclut à un séparé des informations structurales et
prosodiques.
Mots-clés : perception de la parole, segmentation lexicale, indices phonotactiques, indices métriques.L'Année psychologique, 1997, 97, 77-112
Laboratoire de Psychologie expérimentale,
CNRS, URA 316, EPHE, Université René Descartes, Paris F1
RECONNAISSANCE DE LA PAROLE ET INDICES
DE SEGMENTATION MÉTRIQUES ET PHONOTACTIQUES2
par Marie-Hélène BANEL et Nicole BACRI
SUMMARY : Cooperation and conflict between metrical cues and phonotactic
cues in speech segmentation.
Three experiments are reported concerning the relative contributions of
metrical and phonotactic segmentation cues to listeners' word recognition in
French. Listeners had to detect monosyllabic words embedded at the initial
position in nonsense bisyllabic strings that were realized as an iambe, typical
in French for bisyllabic words, a trochee, or a spondee. Experiment 1 extended
the effect of metrical cues to the sequences with two non-coarticulated
consonants in the medial position. Word detection was faster for a trochaic
pattern than for either an iambic pattern or a neutral spondee. Comparing the
effects of cooperating cues and of conflicting cues on detection times,
Experiment 2 found neither interference nor interaction between the
phonotactic and prosodie speech dimensions, but a redundancy gain in the
trochaic condition for both phonotactic conditions. A control experiment
studied the recognition of words extracted from the bisyllabic sequences. It
showed no effect of previous context on word recognition. These results are
discussed in terms of timing mechanisms that may operate either at the level of
syllable perception, or as the basis of a prosodie parsing routine. They indicate
that phonotactic and metrical cues are processed separately.
Key words : speech perception, lexical parsing, speech segmentation,
phonotactic cues, metrical cues.
1 . 28, rue Serpente, 75006 Paris.
2 . Cette recherche a été partiellement financée par le GDR 957 « Sciences
cognitives de Paris ». Marie-Hélène Banel et Nicole Bacri 78
INTRODUCTION
Le langage parlé comporte de nombreux indices, de niveaux
différents, qui permettent dans certains contextes à un auditeur
de repérer les frontières de mots — de savoir où un mot com
mence et où il s'achève. Les marques de frontière sont relativ
ement fiables au début ou à la fin d'un syntagme, ou lorsque est
présent un mot plurisyllabique. Détecter l'emplacement d'une
erreur de prononciation sera d'autant plus aisé que le thème de
la conversation, la structure syntaxique et sémantique de la
phrase où l'erreur est située, construiront chez l'auditeur une
attitude cohérente d'attente le rendant sensible à la modifica
tion d'un phonème (Cole, Jakimik et Cooper, 1980). L'informaportée par un seul mot peut suffire à contraindre la recon
naissance du mot suivant et faciliter la détection d'un phonème
(Blank et Foss, 1978 ; Foss et Blank, 1980). Le début d'un mot
— sa «frontière gauche» — a un statut spécifique et engage déjà
la recherche lexicale, comme le montre la plus grande rapidité
des temps de détection d'une erreur quand elle est située vers la
fin d'un mot plurisyllabique.
Indépendamment de l'intervention de variables syntaxi
ques et sémantiques, dont le rôle dans le traitement du lexique
est au demeurant limité (Bard, Shillcock et Altmann, 1988;
Cotton et Grosjean, 1984 ; Miller, Green et Schermer, 1984), la
structure morphologique et phonotactique des items lexicaux
semble avoir une fonction majeure dans la distribution des
sons successifs en mots. Il en est de même de la structure pro
sodique qui redistribue les segments successifs en unités de
quelques syllabes : les mots prosodiques (Grosjean et Gee,
1987). Toutefois, l'examen du signal de parole montre qu'il est
le plus souvent continu dans une même unité prosodique qui
peut regrouper deux ou trois mots (« La belle ville », par
exemple). Les mots ne sont plus alors des entités facilement
isolables, car les frontières des mots monosyllabiques ne sont le
plus souvent pas marquées dans le signal. La série d'expé
riences présentée ici a pour objectif d'évaluer les rôles respect
ifs d'indices phonotactiques et d'indices prosodiques lors de la
segmentation lexicale en français. Segmentation de la parole 79
Dans le cadre de modèles d'activation interactive, la recon
naissance des mots a été envisagée sous l'angle des compétitions
entre hypothèses lexicales. Le modèle TRACE reconnaît par
exemple party (fête), qu'il ne segmente pas en par (pair) et tea
(thé), grâce à des mécanismes d'appariement continu entre tout
point du signal et les représentations lexicales, et à un avantage
accordé au recouvrement maximum entre informations acousti
ques et lexicales, c'est-à-dire au mot le plus long (McClelland et
Elman, 1986). Alors même que le mot le plus long reçoit le
maximum d'activation, les mots enchâssés qu'il est susceptible
de contenir (par et tea) bénéficient d'une activation transitoire,
qu'ils se situent en position initiale du mot plus long (Frauenfel-
der et Peeters, 1990) ou dans sa partie finale (Shillcock, 1990).
Cette conception de la segmentation permet de faire l'économie
d'un processus de localisation des frontières de mots. Aucun
point du signal n'est privilégié lors du traitement qui est conti

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents