L'expression vocale des émotions : approche interculturelle et développementale - article ; n°3 ; vol.91, pg 383-396

De
Publié par

L'année psychologique - Année 1991 - Volume 91 - Numéro 3 - Pages 383-396
Résumé
L'expression vocale des émotions, domaine de recherche peu étudié, est abordée ici dans une double perspective : interculturelle et développementale. A cet effet, le test de reconnaissance des émotions par la voix (Scherer et Wallbott, 1989), où figurent 30 items évoquant la peur, la colère, la joie, la tristesse ou aucune émotion, a été d'une part appliqué à 50 adultes français comparativement à un groupe d'adultes allemands sur lequel cette épreuve avait auparavant été validée. La procédure a d'autre part été adaptée de façon à pouvoir tester trois groupes de 30 enfants et adolescents de 7, 11 et 15 ans. S''agissant des adultes, les résultats ne mettent en évidence aucune différence majeure entre les deux groupes culturels étudiés. Les résultats obtenus auprès des enfants font apparaître une évolution génétique entre 7 et 15 ans dans la reconnaissance des stimulus vocaux. A 15 ans, les résultats sont comparables à ceux des adultes.
Mots clés : expression vocale des émotions, communication non verbale, test.
Summary : Vocal expression of emotions : A crosscultural and developmental approach.
The vocal expression of emotions, an unexplored field of research, is studied here in a double approach : crosscultural and developmental. The vocal emotion recognition test (Scherer and Wallbott, 1989) mode up of 30 items depicting the emotions fear, anger, joy, sadness as well as utterances considered to be neutral, has been applied to 50 french adults comparatively to a group of german adults on which the test was first validated. This procedure was then adapted to a population of children. Three groups of children and teenagers aged 7, 11 and 15 years were tested. For the adults, the results do not show any major difference between the two cultural groups studied. A developmental evolution appears between 7 and 15 years in the recognition of the vocal stimuli. In the 15 years group, the results are quite similar to those obtained by adults.
Key-words : vocal expression of emotion, non verbal communication, test.
14 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : mardi 1 janvier 1991
Lecture(s) : 10
Nombre de pages : 16
Voir plus Voir moins

Michèle Guidetti
L'expression vocale des émotions : approche interculturelle et
développementale
In: L'année psychologique. 1991 vol. 91, n°3. pp. 383-396.
Citer ce document / Cite this document :
Guidetti Michèle. L'expression vocale des émotions : approche interculturelle et développementale. In: L'année psychologique.
1991 vol. 91, n°3. pp. 383-396.
doi : 10.3406/psy.1991.29473
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1991_num_91_3_29473Résumé
Résumé
L'expression vocale des émotions, domaine de recherche peu étudié, est abordée ici dans une double
perspective : interculturelle et développementale. A cet effet, le test de reconnaissance des émotions
par la voix (Scherer et Wallbott, 1989), où figurent 30 items évoquant la peur, la colère, la joie, la
tristesse ou aucune émotion, a été d'une part appliqué à 50 adultes français comparativement à un
groupe d'adultes allemands sur lequel cette épreuve avait auparavant été validée. La procédure a
d'autre part été adaptée de façon à pouvoir tester trois groupes de 30 enfants et adolescents de 7, 11 et
15 ans. S''agissant des adultes, les résultats ne mettent en évidence aucune différence majeure entre
les deux groupes culturels étudiés. Les résultats obtenus auprès des enfants font apparaître une
évolution génétique entre 7 et 15 ans dans la reconnaissance des stimulus vocaux. A 15 ans, les
résultats sont comparables à ceux des adultes.
Mots clés : expression vocale des émotions, communication non verbale, test.
Abstract
Summary : Vocal expression of emotions : A crosscultural and developmental approach.
The vocal expression of emotions, an unexplored field of research, is studied here in a double approach
: crosscultural and developmental. The vocal emotion recognition test (Scherer and Wallbott, 1989)
mode up of 30 items depicting the emotions fear, anger, joy, sadness as well as utterances considered
to be neutral, has been applied to 50 french adults comparatively to a group of german adults on which
the test was first validated. This procedure was then adapted to a population of children. Three groups
of children and teenagers aged 7, 11 and 15 years were tested. For the adults, the results do not show
any major difference between the two cultural groups studied. A developmental evolution appears
between 7 and 15 years in the recognition of the vocal stimuli. In the 15 years group, the results are
quite similar to those obtained by adults.
Key-words : vocal expression of emotion, non verbal communication, test.L'Année Psychologique, 1991, 91, 383-396
Centre de Psychologie de l'enfant
Université Paris X-Nanterre1
L'EXPRESSION VOCALE DES ÉMOTIONS :
APPROCHE INTERCULTURELLE
ET DÉVELOPPEMENTALE
Michèle Guidetti
SUMMARY : Vocal expression of emotions : A crosscultural and deve
lopmental approach.
The vocal expression of emotions, an unexplored field of research, is
studied here in a double approach : crosscultural and developmental. The
vocal emotion recognition test (Scherer and Wallbott, 1989) made up
of 30 items depicting the emotions fear, anger, joy, sadness as well as
utterances considered to be neutral, has been applied to 50 french adults
comparatively to a group of german adults on which the test was first
validated. This procedure was then adapted to a population of children.
Three groups of children and teenagers aged 7, 11 and 15 years were tested.
For the adults, the results do not show any major difference between the
two cultural groups studied. A developmental evolution appears 7
and 15 years in the recognition of the vocal stimuli. In the 15 years group,
the results are quite similar to those obtained by adults.
Key-words : vocal expression of emotion, non verbal communication,
test.
PROBLÉMATIQUE ET OBJECTIFS
DE LA RECHERCHE :
Depuis Darwin (1872), il ne fait plus de doute que les compor
tements non verbaux jouent un rôle primordial sinon exclusif
dans l'expression des émotions. Dès cette époque, la question
1. 200, avenue de la République, 92001 Nanterre Cedex. Michèle Guideiti 384
était de savoir quelle était la part de l'inné (et donc universel)
et de l'acquis (et donc différent d'une culture à l'autre) dans ce
type de conduite. Dans ce cadre, l'aspect le plus étudié est celui
de l'expression faciale en particulier par Ekman (cf. notam
ment 1982). Cet auteur a montré grâce à de nombreuses études
interculturelles qu'un petit nombre d'expressions faciales des
émotions sont universelles telles celles de la joie, de la colère,
de la peur, du dégoût ou de la tristesse.
Ce n'est que beaucoup plus récemment que les chercheurs,
Scherer en particulier depuis une quinzaine d'années, se sont
penchés sur les phénomènes vocaux. Deux raisons à cela : le
problème de l'interférence avec le langage verbal : ces phéno
mènes n'ont pas été considérés comme des comportements non
verbaux. En outre, d'importantes difficultés méthodologiques,
en partie résolues grâce aux possibilités d'enregistrement numér
ique et de traitement informatique, empêchaient de mener à
bien cette étude.
On sait maintenant avec certitude que des paramètres para-
linguistiques comme l'intonation, la qualité et le rythme de la
voix modulent le code verbal, et qu'en particulier les aspects
vocaux des émissions verbales renseignent sur l'état affectif de
l'émetteur. De plus, des travaux ont montré (cf. revue de ques
tion in Scherer, 1986) que la reconnaissance d'émotions à partir
d'indices vocaux ne se fait pas au hasard et que son étude est
tout aussi heuristique que celle qui concerne l'expression faciale,
l'ensemble devant permettre une meilleure compréhension de la
conversation, « phénomène de communication multicanale »
(Scherer, 1984), comprenant des aspects verbaux, vocaux et
non verbaux (regard, expression faciale, posture, gestes).
Mais le codage vocal des émotions n'est pas encore bien
connu et à ce jour il n'existait pas de comparaison interculturelle
de l'expression vocale des émotions, pas plus que l'on n'avait
étudié ce qu'il en était chez l'enfant (Scherer, 1982). Pourtant,
l'intérêt de cette étude est double : d'une part, savoir si les émot
ions s'expriment par des indices paralinguistiques universaux
ou au contraire spécifiques de chaque culture, d'autre part,
savoir comment l'enfant produit et perçoit ces mêmes indices.
La recherche présentée ici se propose donc de combler en partie
ces lacunes en répondant aux questions suivantes :
1 / La capacité de reconnaître des émotions à partir de stimulus
vocaux est-elle universelle comme cela est le cas pour d'autres L'expression vocale des émotions 385
comportements expressifs ou au contraire existe-t-il des dif
férences culturelles ? Cet article rapporte les résultats obtenus
auprès d'adultes français comparativement à des adultes
allemands. Il s'agit de savoir en fait s'il y a ou pas indépen
dance entre langue et indices vocaux exprimant des émotions.
2 / A quel âge et comment se met en place et évolue la reconnais
sance d'émotions à partir de stimulus vocaux dans des popul
ations d'enfants français? Dans la mesure où, à notre connais
sance, aucune donnée n'est disponible dans ce domaine, ceci
constitue une recherche effectuée à titre exploratoire et dans
une perspective développementale. Il s'agit de savoir ici si
l'enfant apprend indépendamment ou pas la langue et les
indices paralinguistiques en vigueur dans sa culture. L'intérêt
heuristique de l'étude développementale du décodage de
l'expression vocale des émotions se situe à deux niveaux
différents : d'une part, dans la comparaison avec l'adulte
censé maîtriser ces indices de façon optimale, d'autre part,
dans l'étude de l'évolution génétique éventuelle de ces para
mètres.
PROBLÈMES MÉTHODOLOGIQUES ET POPULATIONS ÉTUDIÉES
Le dispositif utilisé dans ce travail est le test de reconnaissance
des émotions par la voix, il est dû à Scherer et Wallbott (1989). Il
s'agit d'une cassette d'une durée de neuf minutes environ où figurent
30 items (plus quatre exemples, voir la liste des items en annexe) évo
quant la peur (5 items), la colère (7), la joie (6) ou la tristesse (8) ou
aucune émotion (neutre : 4 items). On sait que pour d'autres comporte
ments expressifs ces émotions sont universellement reconnues (Ekman,
1982), c'est donc pour cela qu'elles ont été choisies. Ce dispositif devant
être appliqué internationalement et pour éviter un biais lié au contenu
sémantique d'une phrase type (cf. Wallbott, Scherer, 1986), les auteurs
ont mis au point deux « phrases » construites à partir de syllabes sans
signification sélectionnées par un phonéticien d'après leur fréquence
dans les principales langues européennes (anglais, allemand, français,
espagnol, italien, danois) et réagencées sur la base des probabilités
d'organisation phonémique connues pour les langues indo-européennes.
Ces « phrases » (zi göt laich schong kil goster et hat sandik pronn ju
ventsi) sont dites par quatre acteurs professionnels de nationalité all
emande et polyglottes (deux hommes et deux femmes) à qui l'on demande
d'exprimer les émotions précitées à partir de courts scénarios et qui
ont reçu une transcription phonétique des « phrases » à prononcer. Ceci
AP 13 386 Michèle Guidetti
permet d'éviter le biais lié à l'utilisation d'un seul acteur, on sait en
effet que certains d'entre eux sont meilleurs dans l'encodage de certaines
émotions (Wallbott, Scherer, 1986). Les 30 items ont été sélectionnés
après validation par la méthode des juges auprès d'étudiants allemands
de la façon suivante : 88 émissions (4 acteurs x 5 émotions — les
4 émotions évoquées ci-dessus et le dégoût — x 2 scénarios x 2 phrases
+ 2 émissions « neutres » par acteur) ont été jugées sur une échelle
en 6 points d'après l'intensité et le caractère naturel de l'émotion
exprimée. On a retenu les émissions pour lesquelles le taux moyen
d'intensité et de naturel pour l'émotion prévue est supérieur à deux
en équilibrant le nombre d'items produits par les acteurs masculins et
féminins et le nombre de présentations de chacune des deux « phrases »
(cf. liste des items en annexe). L'encodage vocal de l'émotion « dégoût »
n'atteignant pas ce seuil, il a été abandonné.
La passation auprès d'adultes s'effectue de la façon suivante : il
s'agit d'une passation collective dans laquelle les sujets par groupes de
cinq sont assis autour d'un magnétophone muni de casques. Le sujet
doit d'abord lire des instructions lui expliquant le but de l'épreuve et
la façon de procéder, il écoute ensuite la cassette et coche sur une feuille
d'évaluation l'émotion qui lui paraît convenir. Sur cette feuille de
réponse, figurent pour chacun des 30 items et des quatre exemples les
cinq réponses possibles (neutre, colère, peur, joie, tristesse). Sur la
cassette, chaque item est annoncé par un numéro; après une seconde,
la phrase est dite une première fois puis répétée, suit une pause de
six secondes qui laisse au sujet le temps d'évaluer la phrase qu'il vient
d'entendre. Après la pause, un signal sonore annonce l'item suivant,
et ainsi de suite jusqu'au dernier des 30 items.
Trois étapes se sont succédé dans notre travail sur le terrain :
il s'agissait d'abord de voir dans quelle mesure le dispositif qui vient
d'être décrit était applicable à une population d'adultes, constituant
le groupe français de l'étude internationale menée par Scherer
et Wallbott.
Il s'agissait ensuite, et ceci a constitué la partie la plus originale de
la recherche, d'adapter la procédure aux enfants afin de saisir l'évolution
génétique relative à l'expression vocale des émotions. Il fallait examiner
jusqu'à quel âge le dispositif était applicable et dans quelle mesure la
passation devait être adaptée. 50 sujets d'âge compris entre 5 et 25 ans
ont été vus à cette occasion. Ne sachant pas d'emblée comment les
enfants se comporteraient face au matériel présenté et de façon à
fixer précisément l'âge des groupes d'enfants à voir par la suite, il a
été décidé de tester quelques enfants (entre 3 et 5) par niveau scolaire,
de la fin du collège à l'école maternelle.
Finalement, la troisième étape a consisté en l'application de l'épreuve
à 140 sujets, 50 adultes (25 hommes, 25 femmes, étudiants de psychol
ogie âgés de 19 à 25 ans) et trois groupes de 30 enfants et adolescents L'expression vocale des émotions 387
d'âge différent : 7, 11 et 15 ans. Le même nombre de garçons et de filles
figurait dans chacun des groupes.
Auprès des adultes, le dispositif prévu fonctionne parfaitement, il
a donc été appliqué tel quel auprès du groupe de 50 étudiants français.
RÉSULTATS OBTENUS PAR LES ADULTES
II s'agissait ici, rappelons-le, de voir si sujets français et
allemands reconnaissent de la même manière des émotions à
partir de stimulus vocaux ; par la suite, les résultats obtenus
auprès des adultes permettront d'analyser ceux des enfants.
Un premier constat se dégage : globalement, les résultats
obtenus auprès d'une population française sont comparables à
ceux obtenus auprès de sujets allemands. En effet, le tri à plat
des réponses données fait apparaître que sur 30 items, 20 soit
67 % sont majoritairement décodés comme ce qui était prévu :
le pourcentage de réponses en faveur de l'émotion prévue est
supérieur à 50 pour deux items, supérieur à 60 pour les autres.
Si l'on considère en effet qu'un sujet répondant au hasard
aurait 20 % de chances de donner une réponse exacte à chaque
item, il nous a semblé qu'il fallait qu'au moins plus de la moitié
des sujets réponde correctement pour que l'item soit considéré
comme reconnu.
Pour les 10 items restants, les réponses se répartissent de la
façon suivante :
— pour 3 items (14, 18, 22 — voir la liste des items en annexe),
l'émotion prévue vient au premier rang (suivie d'une autre
ou de « neutre ») des réponses données mais le pourcentage
est inférieur à 50 % (proche de 45 %) ;
— pour 5 items (1, 2, 7, 17, 30), le pourcentage de réponses
majoritaire est obtenu pour « neutre » (proche de 50 %) suivi
de l'émotion prévue (supérieur à 40 %) ;
— enfin, pour 2 items (10 et 16), l'émotion prévue n'est pas ou
peu citée, il y a donc confusion encore que dans un des cas (16),
la réponse majoritaire soit « neutre ».
Dans la mesure où globalement il n'y a pas de confusion
entre émotions, on peut donc dire qu'il n'y a pas de différences
culturelles entre une population française et allemande dans la
reconnaissance de stimulus vocaux exprimant des émotions. Il ne Michèle Guidetii 388
sera bien sûr possible de parler d'universalité que quand les
résultats recueillis auprès d'autres groupes culturels seront
connus (article en préparation de Scherer et Wallbott). Ceci est
renforcé par le fait qu'il y a une corrélation significative (r = 0,48,
p < .02) entre les pourcentages de réussite obtenus pour l'émo
tion prévue dans le groupe d'étudiants français et les scores
de jugement produits par les étudiants allemands, ce qui signifie
que les items qui obtenaient des scores de jugement forts auprès
des étudiants allemands sont reconnus correctement à un pour
centage élevé par les adultes français et vice versa.
Il est possible maintenant d'envisager les résultats obtenus
non plus en fonction des scores globaux mais en examinant
les émotions les unes comparativement aux autres. Ainsi, en
considérant la fréquence des réponses correctes (traduite en
pourcentage) données pour chaque type d'émotion, on constate
que l'ordre de difficulté est le suivant :
1 / peur 70,6 % ;
2 / neutre 68,5 % ;
colère % ;
3 / tristesse 67,1 % ;
4 / joie 43,2 %.
Cette différence significative (chi 2, p< .001) dans le déco
dage des émotions (nous reviendrons plus loin sur le cas des
items « neutre ») confirme des résultats obtenus par ailleurs
(Wallbott et Scherer, 1986; Siegwart, 1990 — dans cette
recherche le classement est identique au nôtre), où, de manière
générale, les émotions que l'on peut considérer comme négatives
sont plus aisément décodées que les émotions positives sans que
d'ailleurs l'on puisse déterminer si cela tient à une difficulté
dans l'encodage par les acteurs des positives ou à un
problème de reconnaissance au décodage. Ceci concerne en parti
culier la joie, émotion la moins bien décodée dans l'ensemble
des travaux.
Une autre élaboration des résultats a été effectuée : pour
chaque sujet, on a calculé le total de réponses correctes (à savoir,
le nombre de fois où la réponse donnée est celle de l'émotion
attendue, voir tableau I). Le maximum obtenu est de 26 (sur
30 items), le minimum 11 ; aucun sujet n'arrive donc à décoder
correctement l'ensemble des stimulus mais on vient de voir qu'il
ne s'agit pas d'une spécificité du groupe français. L'écart est L'expression vocale des émolions 389
donc de 15 points, ce qui est relativement important, sans que
l'on puisse donner une explication satisfaisante, nous y revien
drons lorsque seront analysés les résultats obtenus par les
enfants.
Tableau I. — Indices de tendance centrale des réponses
correctes données par les adultes
Means and standard deviations of adults' correct answers
Hommes Femmes Total
Moyenne 19,84 20,56 20,2
Ecart type 3,48 2,85 3,17
On constate que les femmes obtiennent des résultats légèr
ement supérieurs à ceux des hommes sans toutefois que cette
différence soit significative. Nous reviendrons par la suite sur
cette différence entre sexes.
PROBLÈMES MÉTHODOLOGIQUES DÉVELOPPEMENTAUX
II s'agit ici plus particulièrement de l'abord d'un domaine nouveau
et à notre connaissance jamais encore étudié par ailleurs : l'étude de la
reconnaissance de stimulus vocaux exprimant des émotions chez l'enfant
et de son évolution génétique.
Le dispositif précédemment décrit est applicable sans problème parti
culier jusqu'à 1 ans, âge auquel les enfants peuvent lire et cocher seuls
la feuille d'évaluation. Il est particulièrement étonnant de constater
que des enfants si jeunes peuvent rester concentrés avec un casque sur
la tête pendant plus de 9 minutes ! De façon à obtenir une passation
identique pour l'ensemble des enfants quel que soit leur âge, trois
aménagements se sont avérés nécessaires : la passation est individuelle,
la consigne est orale, le premier exemple est écouté sans casque de façon
à vérifier que la procédure a bien été comprise.
Comme on pouvait le deviner aisément, le dispositif prévu ne fonc
tionne plus auprès des enfants fréquentant l'école maternelle. Ne sachant
pas lire, ils n'ont plus de repère sous les yeux pour répondre et sont
obligés de se souvenir des labels d'émotion donnés dans la consigne, ce
qu'ils ont beaucoup de mal à faire. D'autre part, le fait de parler (pour
donner sa réponse ou rappeler les labels d'émotion) déconcentre l'enfant
et lui fait oublier la phrase qu'il vient d'entendre. Enfin, le fait d'avoir
un casque sur la tête les déroute, ce qui n'est plus le cas ne serait-ce 390 Michèle Guidetti
qu'avec des enfants d'un an plus âgés qui sont très fiers de s'identifier
au grand frère ou à la grande sœur écoutant son walk-man. Avec les
enfants d'âge préscolaire, la cassette doit donc être écoutée sans casque.
De façon à mettre en place un repérage visuel, des photos de visages
(extraites d'Ekman, 1972) figurant l'expression faciale des émotions
présentées dans la cassette ont été proposées aux enfants. Mais ceux-ci
font des confusions dans le décodage des photos pourtant validées
auprès d'adultes et d'enfants de différentes cultures. En fait, avec ce
nouveau matériel, on ne teste plus tout à fait la même chose (correspon
dance stimulus vocal / label d'émotion dans un cas, correspondance
stimulus vocal / mimique faciale dans l'autre), même si auprès d'adultes
il n'y a, semble-t-il, pas de différence entre réponses données à partir de
photos et réponses données à partir de labels (Frijda, 1990, communic
ation personnelle). En conséquence, il a été décidé de centrer pour
l'instant notre approche sur les enfants d'âge scolaire et de mettre au
point ultérieurement un dispositif plus adapté aux enfants fréquentant
l'école maternelle.
Les résultats présentés ci-dessous concernent donc les trois groupes
d'enfants et d'adolescents de 7, 11 et 15 ans. Ces âges ont été choisis
car, d'une part, la pré-expérience a montré qu'il ne semblait pas y avoir
d'évolution génétique rapide dans la reconnaissance des stimuli, ceci
justifie l'adoption d'un écart d'âge de quatre ans entre les différents
groupes ; d'autre part, 7 ans (début de la scolarisation en école primaire)
est l'âge limite en dessous duquel la procédure n'est plus applicable.
RÉSULTATS OBTENUS PAR LES ENFANTS
Si l'on prend comme référence les réponses données par les
adultes censés avoir validé ce test sur une population française,
les réponses se répartissent comme suit : sur les 20 items pour
lesquels le pourcentage de reconnaissance de l'émotion prévue
est supérieur à 50, on constate que :
— pour 15 items (4, 6, 8, 9, 13, 15, 19, 20, 21, 23, 24, 25, 26,
27, 28), il y a globalement une évolution génétique ;
— pour 4 items (3, 5, 11, 29), l'évolution est irrégulière avec
parfois des résultats dans le groupe adulte inférieurs à ceux
obtenus dans un des groupes d'enfants ;
— pour un item (12), il y a baisse constante en passant des
enfants de 7 ans aux enfants de 15 ans puis remontée pour
atteindre un pourcentage qui devient majoritaire chez les
adultes.

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.