La voix et la communication des affecta - article ; n°2 ; vol.83, pg 537-560

De
Publié par

L'année psychologique - Année 1983 - Volume 83 - Numéro 2 - Pages 537-560
Résumé
Une revue critique des travaux récents sur les relations entre les phénomènes prosodiques de la parole et la communication des affects, dans les domaines de la personnalité, des émotions et en psychopathologie montre à la fois l'intérêt et les difficultés d'une telle entreprise.
Les problèmes sont d'ordre théorique et méthodologique :
— Quel statut théorique assigner à la prosodie dans une théorie psychologique du langage ?
— Quels paramètres acoustiques et/ou auditifs sont pertinents pour montrer les modifications de la voix en fonction de l'état mental des sujets ?
Cette approche semble féconde, car malgré la diversité des techniques et des méthodes, il se dégage deux patterns caractéristiques d'une dimension générale d'activation, différents par les niveaux de la fréquence fondamentale, l'intensité et le tempo.
Mots clefs : prosodie, affects, personnalité.
Summary : A review of recent literature on the relations between prosodic phenomena of speech and the communication of affects in the fields of personality, emotions and psychopathology, reveals both the interest and the problems which such studies encounter.
The problems are theoretical and methodological :
— What theoretical status a psychological theory of language should attribute to prosody ?
— What are the relevant acoustic and auditory parameters for showing the modifications of voice, as a function of the subjects' mental state ?
This approach seems fruitful ; in spite of the variety of techniques and methods used, some characteristic patterns of a general dimension of activation emerge from the studies reviewed ; two basic patterns are gene-rally described, which differ in their pitch level, intensity and tempo.
Key-words : Prosody, affects, personality.
24 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : samedi 1 janvier 1983
Lecture(s) : 53
Nombre de pages : 25
Voir plus Voir moins

R. Menahem
La voix et la communication des affecta
In: L'année psychologique. 1983 vol. 83, n°2. pp. 537-560.
Résumé
Une revue critique des travaux récents sur les relations entre les phénomènes prosodiques de la parole et la communication des
affects, dans les domaines de la personnalité, des émotions et en psychopathologie montre à la fois l'intérêt et les difficultés
d'une telle entreprise.
Les problèmes sont d'ordre théorique et méthodologique :
— Quel statut théorique assigner à la prosodie dans une théorie psychologique du langage ?
— Quels paramètres acoustiques et/ou auditifs sont pertinents pour montrer les modifications de la voix en fonction de l'état
mental des sujets ?
Cette approche semble féconde, car malgré la diversité des techniques et des méthodes, il se dégage deux patterns
caractéristiques d'une dimension générale d'activation, différents par les niveaux de la fréquence fondamentale, l'intensité et le
tempo.
Mots clefs : prosodie, affects, personnalité.
Abstract
Summary : A review of recent literature on the relations between prosodic phenomena of speech and the communication of
affects in the fields of personality, emotions and psychopathology, reveals both the interest and the problems which such studies
encounter.
The problems are theoretical and methodological :
— What theoretical status a psychological theory of language should attribute to prosody ?
— What are the relevant acoustic and auditory parameters for showing the modifications of voice, as a function of the subjects'
mental state ?
This approach seems fruitful ; in spite of the variety of techniques and methods used, some characteristic patterns of a general
dimension of activation emerge from the studies reviewed ; two basic patterns are gene-rally described, which differ in their pitch
level, intensity and tempo.
Key-words : Prosody, affects, personality.
Citer ce document / Cite this document :
Menahem R. La voix et la communication des affecta. In: L'année psychologique. 1983 vol. 83, n°2. pp. 537-560.
doi : 10.3406/psy.1983.28482
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1983_num_83_2_28482L'Année Psychologique, 1983, S3, 537-560
Laboratoire de Psychologie médicale1
LA VOIX ET LA COMMUNICATION DES AFFECTS
par Ruth Menahem
« Quand /' entends parler quelqu'un,
au travers de la mélodie du mot, je vois
bien plus profondément dans son âme. »
Janos Janacek (Jenufa).
S UMMAR Y : A review of recent literature on the relations between
prosodie phenomena of speech and the communication of affects in the
fields of personality, emotions and psychopathology , reveals both the interest
and the problems which such studies encounter.
The are theoretical and methodological :
— What theoretical status a psychological theory of language should
attribute to prosody ?
— What are the relevant acoustic and auditory parameters for showing
the modifications of voice, as a function of the subjects' mental state ?
This approach seems fruitful ; in spite of the variety of techniques and
methods used, some characteristic patterns of a general dimension of
activation emerge from the studies reviewed ; two basic patterns are gene
rally described, which differ in their pitch level, intensity and tempo.
Key-words : Prosody, affects, personality.
INTRODUCTION
La voix est certainement l'un des indicateurs les plus sensibles
pour traduire et trahir l'état affectif d'un locuteur. Mais les constatat
ions empiriques et cliniques sur les modifications de la voix, n'ont
1. era 192, Pr P. Pichot, chu Sainte-Anne, 100, rue de la Santé, 75014,
Paris. 538 Ruth Me nahem
pas encore reçu de réelle confirmation expérimentale. Les différentes
revues critiques, depuis les années 30 (Diehl, 1960; Davitz, 1969;
Scherer, 1979) s'accordent sur cet écart entre l'évidence empirique et
les résultats expérimentaux. En dépit de l'évolution des techniques
d'analyse de la voix, les interrogations restent identiques : quels sont
les paramètres acoustiques et/ou perceptifs spécifiques de certains états
émotionnels, ou permettant de décrire des traits de personnalité ?
Les difficultés d'une telle approche sont de deux ordres : théorique
et méthodologique :
— Sur le plan théorique, quel est le statut des phénomènes proso
diques dans une théorie de la communication ? Et, plus précisément,
comment formaliser la variabilité de l'information prosodique qui est
présente à tous les niveaux déstructuration du signal de parole. L'absence
d'un statut théorique a pour conséquence l'imprécision des concepts
utilisés, malgré les efforts de certains auteurs (Laver, 1980), pour en
affiner les descriptions par la prise en compte de l'interaction entre les
facteurs anatomo-physiologiques et phonétiques.
En ce qui concerne les émotions et la personnalité, les difficultés
ne sont pas moindres : du choix de la théorie de la personnalité, choix
implicite ou explicite, dépendront les modalités mises en relation avec
les critères de la voix. Quant aux différentes émotions, leur définition
reste entièrement empirique.
— • Sur le plan méthodologique, cette mise en relation de deux phé
nomènes mal conceptualisés ne peut que faire problème : nous en
relèverons les différents aspects sur le terrain des recherches.
Et pourtant, malgré ces difficultés, les résultats de ces tentatives
d'étude de la voix ne sont pas négligeables et constituent une approche
originale et féconde des relations entre les affects et les aspects proso
diques du langage. Elles apportent une contribution préalable à l'él
aboration d'une analyse totale de la communication.
Pour cette revue critique, ont été retenues les études récentes
reliant certains aspects de la prosodie, en particulier l'intonation, aux
émotions et à la personnalité, normale ou pathologique.
Les informations sémantiques et syntaxiques qui renvoient aux
aspects linguistiques de l'intonation, ne sont pas prises en compte pour
n'en retenir que les aspects expressifs.
Pour introduire ces études, il a paru utile de rappeler quelques
généralités sur les qualités de la voix et les phénomènes prosodiques et
leurs fonctions. Après la revue des recherches dans quatre domaines :
la personnalité, le stress, les émotions et la psychopathologie, sera
tentée une élaboration des phénomènes prosodiques dans une théorie
psychologique du langage. voix et la communication des affects 539 La
I. — GÉNÉRALITÉS
SUR LES PHÉNOMÈNES VOCAUX
1.1. Des vocalisations affectives au langage articulé
On doit à Darwin — dont on fête cette année le centenaire de la
mort — - les premières conceptualisations et les fondements des recher
ches dans le domaine de l'expression des émotions chez l'homme et chez
l'animal. Darwin (1972) considère les vocalisations comme des sous-
produits des réponses fonctionnelles d'adaptation à l'environnement.
Tel serait par exemple le sens de la profonde inspiration dans la sur
prise, nécessaire pour se préparer à un effort prolongé, ou encore l'expi
ration dans le dégoût afin d'expulser un élément nocif.
Cette adaptation physiologique présente en outre une utilisation à des
fins de communication, surtout quand la vocalisation implique la pho
nation. En effet, la transmission du signal doit être efficace ; ainsi, un
appel de détresse doit être fort, prolongé et aigu. Les deux fonctions
essentielles des vocalisations affectives sont : l'expression des émotions
et la communication.
De par sa structure, le larynx des primates est mieux adapté à la
phonation à des fins de communication qu'à la protection optimale des
voies respiratoires (Lieberman, 1975). Il est fort probable — et c'est
l'opinion généralement admise • — que les mécanismes mésencépha-
liques de vocalisation subsistent chez l'homme malgré la présence du
néocortex et jouent un rôle dans les caractéristiques prosodiques du
langage humain (Chevalier-Skolniko, 1973).
On est alors en droit de se demander, dans une perspective évolu-
tionniste, si la prosodie n'est pas la survivance de ces vocalisations
affectives, s'il n'y a pas là une continuité phylogénétique.
A titre d'exemple, on peut considérer comme un retour aux vocali
sations affectives, le langage des bandes dessinées, fait d'interjections,
d'onomatopées, d'intonations marquées graphiquement dont le pouvoir
d'évocation et d'émotion est d'autant plus grand qu'il représente une
libération des contraintes du code linguistique.
Une autre illustration est fournie par des travaux sur les vocalisations
des singes-écureuils (Jürgens, 1979) ; les indicateurs vocaux — intens
ité, hauteur et tempo — des stimuli plaisants ou aversifs recouvrent
parfaitement les résultats fournis par deux types d'émotions, agréable
et désagréable, chez les sujets humains utilisant le langage articulé.
Il existe aussi une continuité ontogénique mise en évidence par les
travaux sur le babillage (de Boysson-Bardies, Bacri, Sagart et Poizat,
1981 ; Bacri de Boysson-Bardies, et 1981); la mélodie du babillage est
conforme à la mélodie de la langue en usage dans une communauté Ruth Menahem 540
linguistique donnée. On sait que c'est l'intonation générale de la phrase
qui entraîne la compréhension bien avant celle du sens des mots. Dès
l'âge de trois mois les courbes mélodiques sont associées à un certain
contenu.
L'importance de la prosodie dans la parole articulée est fondamentale
tant du point de vue des informations lexicales et syntaxico-séman tiques
(Buttet, Winfield et Sandoval, 1980) que du point de vue des informat
ions sur l'implication du sujet dans son discours. Une phrase banale
telle que « Jean-Marie va manger mon enfant » peut présenter, selon
son intonation, des nuances de sens allant jusqu'à l'intention canni-
balique ; on peut aussi y découvrir le type de relation entre le locuteur
et Jean-Marie selon le ton, séducteur, agressif ou neutre utilisé (Delattre,
1972).
Ces différents rôles de la prosodie dans la représentation et le trait
ement de la parole sont en interaction et la centration sur l'un ou l'autre
de ces aspects ne peut être qu'un artifice expérimental.
1.2. Aperçu sur les mécanismes de production
de la parole
1.2.1. Physiologie de l'appareil phonatoire
Les contraintes liées à la structure de l'appareil phonatoire humain
vont jouer un rôle déterminant dans les possibilités de modulation
de la voix. Pour comprendre comment ces structures physiologiques
peuvent être modifiées dans les états émotionnels et entraîner des
changements des caractéristiques acoustiques de la voix, il faut se
demander ce qui se passe quand on produit un son.
Prenons le cas d'une voyelle : une colonne d'air est mise en vibration
par l'air provenant des poumons à travers la glotte. La disposition parti
culière du pharynx, du palais, de la langue, des lèvres et des dents va
former une caisse de résonance privilégiant certains harmoniques de la
fréquence fondamentale de l'onde sonore périodique qui correspond au
formant de cette voyelle. La tension des cordes vocales est sous la régu
lation de deux muscles antagonistes et d'un muscle abducteur. Il faut
retenir que l'écartement et le rapprochement des cordes vocales qui
entraîne leur tension ou leur relâchement, ne dépendent pas des mêmes
muscles. Ceux-ci jouent le rôle d'un sphincter placé sur la trachée qui
imprime état de tension aux cordes vocales.
Il faut ajouter à ces phénomènes phonatoires tous les mécanismes
au niveau articulatoire qui vont modifier le son pour en faire une parole
intelligible.
Plusieurs niveaux de structuration du signal de parole sont en jeu
et les mécanismes physiologiques qui sous-tendent la production des
sons sont encore mal connus ; deux théories différentes en rendent voix et la communication des affects 541 La
compte : une théorie myoélastique et une théorie neuroehronaxique.
On comprend que toute modification du tonus musculaire et de la
coordination motrice va affecter les qualités de la voix.
Pour comprendre de quelle façon les modifications physiologiques
dues à des états affectifs peuvent se répercuter sur les émissions vocales,
il faut connaître la structure du signal de parole ainsi que les relations
entre les structures phonétiques et les réalisations vocales.
1.2.2. Structure du signal de parole
Ce signal véhicule deux sortes d'informations :
— des informations segmentales qui donnent le contenu phonétique
du signal. Il faut noter qu'il n'y a pas de correspondance simple
entre un segment du signal et un phonème. Selon le locuteur, le
contexte, la vitesse d'élocution ou le soin de l'articulation, les fo
rmants d'une même voyelle auront des fréquences et des intensités
différentes ;
— des informations suprasegmentales ou informations prosodiques,
c'est-à-dire l'évolution de la fréquence fondamentale, la répartition
des pauses et l'intensité du signal. La structure en est encore incon
nue. Le découpage en unités prosodiques semble lié aux structures
de dialogue, à la syntaxe, au sens, au lexique.
1.2.3. Description phonétique des qualités de la voix
On pourra se reporter au travail de Laver (1980) pour une descrip
tion phonétique des qualités de la voix. Le système descriptif proposé
repose sur des bases auditives. C'est un modèle phonétique général
applicable aux performances vocales de tous les sujets humains dont
l'équipement anatomique et physiologique est normal. Les composantes
auditives isolées ont des rapports spécifiques avec chacun des autres
niveaux d'analyse — articulatoire, physiologique et acoustique — et
peuvent donner lieu à des vérifications instrumentales.
Cependant, ces arrangements (settings) suprasegmentaux des qual
ités auditives ne permettent pas pour autant d'en inférer le type de
fonction dans la communication linguistique, paralinguistique ou extra
linguistique. L'auteur distingue trois grands groupes d'arrangements
phonétiques : supralaryngés, phonatoires et de tension. Ce dernier
groupe n'est pas homogène avec les deux précédents qui renvoient à des
parties du système vocal, puisque les différents degrés de tension
musculaire exercent leurs effets sur l'ensemble du système.
Les différents degrés de tension, dont les extrêmes caractérisent
les voix tendues et relâchées, peuvent être décrits en fonction des fac
teurs physiologiques, auditifs et acoustiques qui contribuent a les
déterminer. 542 Ruth Menahem
Nous rencontrerons ces effets dus aux modifications du tonus
musculaire dans les recherches en pathologie, en particulier en ce qui
concerne la dépression. L'accord semble être réalisé sur les caracté
ristiques acoustiques de la tension : les différents degrés de tension
sont liés à la quantité relative d'énergie dans les bandes de fréquence
élevées. On possède là un critère acoustique qui peut contribuer à
rendre compte des modifications pathologiques de la voix.
1.3. Choix des paramètres pertinents
Pour répondre aux exigences expérimentales, il va être nécessaire
de sélectionner des paramètres acoustiques susceptibles de rendre
compte des informations contenues dans l'expression vocale et qui sont
perceptivement identifiables. Pour une étude psychologique et non pas
linguistique, le niveau d'analyse sera suprasegmental, on va s'intéresser
à la prosodie.
Les traits prosodiques du langage comprennent le contour d'into
nation, l'accent et le rythme. Les principaux paramètres perceptifs de
la voix sont :
— la hauteur qui est déterminée par la fréquence de vibration des
cordes vocales ;
— l'intensité qui dépend de la pression sous-glottique ;
— le timbre qui correspond à la durée de la phase d'accolement des
cordes vocales, et de leur tonus.
1.3.1. Modalités d'analyse de la voix en production
Pour étudier la courbe mélodique de la phrase, on va choisir un
paramètre global, le contour d'intonation qui autorise la description
d'une séquence en une suite de variations de hauteur, perceptuellement
distinctes et acoustiquement représentées par les variations de la fr
équence fondamentale, notée F.
Le choix de ce paramètre que sont les variations de hauteur, est
justifié par son adéquation à la perception de l'intonation et comme indi
cateur de la structuration des séquences.
D'autres paramètres acoustiques — la durée et ses variations ainsi
que l'amplitude et ses variations — sont pris en compte dans bon nombre
de recherches.
1.3.2. Modalités d'analyse en reconnaissance
Pour affecter une voix à un type d'émotion ou à une caractéristique
de la personnalité, on utilise généralement des échelles de type diffé-
renciateur sémantique afin de localiser la voix dans un espace plur
idimensionnel. La voix et la communication des affects 543
L'utilisation de méthodes plus directes portant soit sur une descrip
tion des qualités de la voix, soit sur l'affectation d'une voix à une émot
ion spécifique, montre une plus grande variabilité des jugements
due à l'imprécision des termes utilisés.
Différentes techniques de masquage du sens par l'utilisation de
filtres passe-bande ou de random-splicing (technique qui consiste à
découper la bande en segments que l'on recolle ensuite au hasard),
visent à neutraliser les interactions du sens et de la prosodie.
La mise en correspondance des indices fournis par l'appareillage
d'analyse acoustique avec les impressions auditives fournies par l'oreille
reste un problème sans solution.
II. — LES VARIATIONS DE L'INTONATION
ET L'ÉTAT MENTAL
L'évidence empirique et clinique d'une relation entre l'état mental
d'un sujet et sa voix a été soumise à de nombreuses tentatives de véri
fication expérimentale.
Les perturbations de l'émission vocale peuvent être la conséquence
de dysfonctionnements à différents niveaux : les troubles des effecteurs
musculaires ou laryngés ainsi que les déficits anatomiques ou physiolo
giques n'entrent pas dans le cadre de cette revue. Nous ne considérons
que les cas où les effecteurs fonctionnent de façon normale, mais où
la commande corticale ou diencéphalique entraîne des perturbations
caractéristiques.
En particulier, comment va se traduire l'action du sympathique ?
L'élévation générale du tonus musculaire strié qui en est la conséquence
va affecter la voix : elle va provoquer une élévation du fondamental,
à moins que le niveau ne soit maintenu constant par un feed-back
proprioceptif ou un monitoring auditif. La coordination des groupes
musculaires va aussi se trouver atteinte ainsi que les rythmes d'inhibition
et d'excitation réciproques. Cette désorganisation de la coordination
neuromusculaire peut avoir des répercussions sur l'intensité, la hauteur,
le contour d'intonation, le débit, la précision de l'articulation et le
rythme.
L'objectif des travaux passés en revue est de montrer comment
cette activation neuromusculaire générale va se traduire sous une forme
caractéristique en fonction de l'état affectif du sujet. Y a-t-il des confi
gurations spécifiques en fonction du type d'émotion vécue et cette
spécificité est-elle constante chez tous les individus d'une même com
munauté linguistique ? 544 Bulh Menahem
2.1. Voix et dimensions de la persoxnalité
En ce domaine, l'écart entre la relative facilité des jugements naïfs
que l'on peut faire à partir de la voix seule, par exemple au téléphone,
et les résultats expérimentaux, est très grand.
On trouve dans Scherer (1981), une revue des travaux américains et
allemands. Les résultats sont peu concluants et font surtout état des
grandes différences inter-individuelles, des différences entre sexes et
entre locuteurs de cultures différentes. Aucun des paramètres étudiés
— fréquence fondamentale, intensité et timbre — n'a pu être relié à un
trait de personnalité.
Seule la dimension extraversion/introversion testée sur des sujets
allemands et américains par Scherer (1974 b), Scherer et Oshinsky
(1977), Scherer et Scherer (1981) semble, sous certaines réserves, associer
des caractéristiques de la voix à cette dimension. Il s'agit pour des
juges de situer sur des échelles de personnalité des enregistrements de
voix dont le contenu est masqué à l'aide de la technique de random-
splicing (fragmentation de la bande et recollage au hasard des morceaux).
Les résultats sont intéressants en ce qu'ils montrent des différences
entre les deux groupes de sujets, américains et allemands. Si pour les
Américains l'extraversion est bien jugée, c'est la dominance qui l'est
pour les Allemands.
Les traits de personnalité jugés semblent liés à la désirabilité sociale
selon un certain stéréotype culturel.
Malgré les résultats inconsistants, il semble bien que la voix d'un
locuteur entretient des rapports avec sa personnalité. Mais à quel
niveau ? Tout ce que l'on peut dire c'est que ce n'est pas à celui des
traits dégagés par les échelles de personnalité (Cattell ou Eysenck).
L'inexactitude des jugements portés sur les caractéristiques de la per
sonnalité peut être attribuée à plusieurs causes : Scherer (1979) propose
un modèle basé sur la lentille de Brunswik pour différencier ces causes :
— absence de lien entre les indices de la voix étudiée et les traits de la
personnalité ;
— échec des auditeurs à percevoir ces indices vocaux ;
— inference inexacte des auditeurs pour attribuer des traits de person
nalité à des indices vocaux.
Mais l'échec nous paraît avoir des causes plus profondes ; en effet,
la réduction expérimentale aux seuls paramètres prosodiques néglige et
les relations entre prosodie et signification lexicale et les relations entre
les locuteurs.
Essayer de trouver une relation bi-univoque entre des paramètres
vocaux et des traits de personnalité est prématuré ; on ignore les indices
pertinents et aussi le « comment » de leur effet sur la voix. La mise en
relation de deux organisations aussi complexes reste à un niveau intuitif. La voix et la communication des affecls 545
2,2. Les indicateurs vocaux du stress
Parmi les concomitants physiologiques du stress, les modifications
respiratoires et celles de la tension musculaire doivent entraîner des
effets sur la voix. On peut avancer l'hypothèse d'une élévation de l'inten
sité et du fondamental due à l'augmentation de la pression sous-glottale
ainsi qu'un déplacement de la concentration d'énergie dans les bandes
de fréquence élevée.
L'étude expérimentale du stress peut se faire soit en situation réelle,
soit en laboratoire dans des situations de simulation.
2.2.1. Etude du stress en situation réelle
II s'agit d'études portant principalement sur des situations de
danger en vol ; les communications air-sol font état d'une élévation du
fondamental avec de brusques variations des contours d'intonation
chez les pilotes étudiés par Williams et Stevens (1969). Des résultats
identiques sont trouvés par Niwa (1970), Fryiwara, Okamura, Itsuki
et Kuroda (1976).
Un travail russe sur des astronautes (Simonov et Frolov, 1973)
rapporte des modifications dans la distribution de l'énergie dans le
spectre, dans le sens d'une concentration dans les bandes de fréquence
élevée. Ce même phénomène est retrouvé par Roessler et Lester (1979)
dans l'étude des communications d'un pilote en situation de panique.
Dans des recherches d'orientation clinique (Häuser, 1976), lors de
sessions de conseil supposées stressantes, on note aussi l'élévation du
fondamental chez certains sujets ; sont-ils les seuls à être stressés ou
est-ce l'effet des différences interindividuelles ?
On note aussi les signes vocaux du stress chez des patients déprimés
lors de leur entretien d'admission, avec retour à la normale à la sortie
(Tolkmitt, 1980).
2.2.2. Induction du stress en laboratoire
L'induction du stress par la projection de films d'épouvanté ou par
la menace de chocs électriques se traduit de la même façon par des
tendances à l'élévation du fondamental et de l'intensité et la concent
ration de l'énergie dans les bandes de fréquence élevée. Si on ne peut
parler que de tendances, c'est que les différences interindividuelles
sont trop importantes pour tirer des conclusions certaines. Pour expli
quer ces différences il faudrait connaître le degré de stress induit ainsi
que la variabilité des réactions vocales (Helfrich et Scherer, 1977 ;
Roessler et Lester, 1979).
Les problèmes qui se posent sont identiques à ceux des autres

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.