Stratégies d'abréviation de mots français - article ; n°1 ; vol.88, pg 47-63

De
Publié par

L'année psychologique - Année 1988 - Volume 88 - Numéro 1 - Pages 47-63
Résumé
On a demandé à des sujets de produire des abréviations de longueur fixe à partir de mots français dont la structure était contrôlée. Il apparaît que les consonnes sont reportées dans les abréviations de préférence aux voyelles, et que les lettres les plus à gauche sont reportées de préférence aux lettres les plus à droite. Il apparaît aussi que les initiales syllabiques et les initiales morphémiques, lorsqu'il s'agit de voyelles, sont reportées suivant des stratégies surprenantes qui appellent quelques réserves quant à l'interprétation. Toutefois, on peut dégager clairement une prépondérance des initiales syllabiques lorsqu'il s'agit de consonnes.
Mots clés : écriture, mot, abréviation.
Summary : Abbreviation strategies for French words.
Subjects were required to create fixed-length abbreviations of French words, the structure of these words being experimentally controlled. Il was found lhat consonants were used in the abbreviations more systematically than were vowels, and that leftmost letters were employed more systematically than were rightmost letters. It was also found that the initial letters of syllables and of morphemes, when these letters were vowels, were used according to rather surprising strategies, that call for cautious interpretation. However, an advantage for the initial letters of syllables was clearly found when these letters were consonants.
Key words : writing, word, abbreviation.
17 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : vendredi 1 janvier 1988
Lecture(s) : 35
Nombre de pages : 18
Voir plus Voir moins

Pierre Courrieu
Stratégies d'abréviation de mots français
In: L'année psychologique. 1988 vol. 88, n°1. pp. 47-63.
Résumé
On a demandé à des sujets de produire des abréviations de longueur fixe à partir de mots français dont la structure était
contrôlée. Il apparaît que les consonnes sont reportées dans les abréviations de préférence aux voyelles, et que les lettres les
plus à gauche sont reportées de préférence aux lettres les plus à droite. Il apparaît aussi que les initiales syllabiques et les
initiales morphémiques, lorsqu'il s'agit de voyelles, sont reportées suivant des stratégies surprenantes qui appellent quelques
réserves quant à l'interprétation. Toutefois, on peut dégager clairement une prépondérance des initiales syllabiques lorsqu'il
s'agit de consonnes.
Mots clés : écriture, mot, abréviation.
Abstract
Summary : Abbreviation strategies for French words.
Subjects were required to create fixed-length abbreviations of French words, the structure of these words being experimentally
controlled. Il was found lhat consonants were used in the abbreviations more systematically than were vowels, and that leftmost
letters were employed more systematically than were rightmost letters. It was also found that the initial letters of syllables and of
morphemes, when these letters were vowels, were used according to rather surprising strategies, that call for cautious
interpretation. However, an advantage for the initial letters of syllables was clearly found when these letters were consonants.
Key words : writing, word, abbreviation.
Citer ce document / Cite this document :
Courrieu Pierre. Stratégies d'abréviation de mots français. In: L'année psychologique. 1988 vol. 88, n°1. pp. 47-63.
doi : 10.3406/psy.1988.29250
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1988_num_88_1_29250L'Année Psychologique, 1988, 88, 47-63
Centre de Recherche en Psychologie cognitive
UA 182, CNRS
Université de Provence1
STRATÉGIES D'ABRÉVIATION
DE MOTS FRANÇAIS2
par Pierre Courrieu
SUMMARY : Abbreviation strategies for French words.
Subjects were required to create fixed-length abbreviations of French
words, the structure of these words being experimentally controlled. It was
found that consonants were used in the abbreviations more systematically
than were vowels, and that leftmost letters were employed
than were rightmost letters. It was also found that the initial letters of
syllables and of morphemes, when these letters were vowels, were used
according to rather surprising strategies, that call for cautious interpret
ation. However, an advantage for the initial letters of syllables was clearly
found when these letters were consonants.
Key words : writing, word, abbreviation.
INTRODUCTION
L'abréviation de mots est un processus de production écrite
très courant qui se rencontre par exemple dans les activités
nécessitant des prises de notes en temps réel (cours, secrétariat,
journalisme, etc.), ou encore les activités nécessitant l'élabora
tion de notations symboliques à la fois courtes et évocatrices,
comme la dénomination des objets d'un programme informatique
ou des éléments de son dialogue avec l'environnement.
1. 29, avenue Robert-Schuman, 13621 Aix-en-Provence Cedex.
2. Etude réalisée dans le cadre du contrat d'ATP (Action thématique
programmée), cnrs, n° 1099 (responsable : C. Touratier). 48 Pierre Courrieu
Des études déjà anciennes avaient permis de recueillir un
certain nombre de données concernant le décodage et la restau
ration de textes (en langue anglaise) ayant subi différents types
de mutilations dont certaines pourraient être assimilées à des
abréviations (Miller et Friedman, 1957). Ces études montraient
en particulier qu'il est plus facile de restaurer des lettres omises
à la fin des mots plutôt que des lettres omises au début des mots.
Toutefois, bien que la linguistique semble porter actuellement
quelque intérêt à l'abréviation, la littérature expérimentale en
psychologie est étrangement pauvre en études concernant l'abré
viation en tant que processus de production.
Fondamentalement, l'abréviation devrait mettre en jeu des
processus de nature psycholinguistique opérant sur des objets
d'une langue naturelle pour les transformer en des objets d'un
langage plus ou moins artificiel entretenant des liens particuliers
avec la langue source. On peut supposer que cette transformat
ion suit un certain nombre de règles dépendant de la représen
tation mentale que le sujet a des objets de la langue, mais aussi
des inferences qu'il peut faire sur les processus de restauration
de l'objet original à partir de l'objet transformé. Abréger un
mot consiste essentiellement à supprimer certains des compos
ants de sa forme sensible, par exemple des lettres. On peut
alors penser que les composants à prioritairement sont
ceux qui sont perçus comme les plus « redondants » (en un sens
dépendant du processus de restauration supposé), et ceux qui
n'ont pas un rôle « clef » dans la représentation mentale du mot
(en un sens dépendant bien sûr de la nature et de la structure
de cette représentation).
Pour ce qui est de la redondance des composants, on sait que
certaines lettres sont par elles-mêmes plus prédictibles que
d'autres. C'est par exemple le cas des voyelles par rapport aux
consonnes. En effet, la structure syllabique de la langue impose
l'apparition assez régulière de voyelles dans les mots. D'autre
part, les voyelles étant nettement moins nombreuses que les
consonnes dans l'alphabet latin, elles sont aussi plus prédictibles.
De fait, si l'on calcule explicitement la redondance positionnelle
des lettres sur un échantillon du lexique français (cf. Courrieu,
1983, p. 123-129), on s'aperçoit que cette est fort
ement corrélée avec la probabilité d'apparition de voyelles. On
pourrait donc s'attendre à ce que les voyelles tendent à être
éliminées plus souvent que les consonnes dans les abréviations. Stratégies d'abréviation 49
On peut noter à ce sujet que le « sacrifice » des voyelles est
largement employé dans des techniques de type sténogra-
phique.
Mais la nature de la lettre n'est pas le seul facteur détermi
nant de la redondance, il faut également considérer la position
de la lettre dans le mot. Le problème est un peu plus complexe
car on peut définir différentes sortes de redondances liées à la
position. Il y a tout d'abord la « redondance positionnelle »,
qui est une mesure de la prédictibilité des lettres à une position
déterminée, indépendamment de l'identité des lettres environ
nantes. Il y a d'autre part ce que l'on peut appeler la « redon
dance contextuelle », qui est une mesure de prédictibilité d'une
lettre compte tenu des lettres environnantes. Il y a enfin la
« redondance séquentielle », qui est une mesure de prédictibilité
des lettres compte tenu du contexte qui les précède. La redon
dance séquentielle est donc une sorte de redondance contextuelle
unilatérale qui est liée à l'idée de processus opérant séquentiell
ement dans un sens déterminé. Il se trouve que ces trois mesures
de redondance ne sont pas, en général, compatibles entre elles.
Typiquement, la redondance séquentielle augmente de façon
pratiquement monotone en fonction du rang des lettres dans le
mot, alors que les deux autres types de redondances donnent
des fonctions pouvant être franchement non monotones. Il est
alors clair que si le scripteur rédigeant des abréviations se repré
sente le processus de restauration du mot comme un processus
plutôt séquentiel, il aura tendance à éliminer les lettres les plus
à droite dans le mot, puisque ce sont celles qui sont séquentiell
ement les plus redondantes. Mais il se peut aussi que le scripteur
ait une autre idée du processus de restauration et qu'il adopte
une stratégie toute différente. En particulier, l'observation d'abré
viations courantes dans les prises de notes suggère parfois que
les lettres finales tendent à être conservées, tout comme les
initiales, surtout s'il s'agit de consonnes, les lettres mediales
étant les plus sacrifiées. Toutefois, cette éventuelle stratégie
d' « encadrement » du mot semble assez difficile à rattacher à des
déterminants connus, si ce n'est peut-être des déterminants
purement perceptifs liés au fait que, dans la lecture courante,
les lettres extrémales peuvent être plus « visibles » que les lettres
mediales en raison des phénomènes de masquage latéral. On
pourrait alors imaginer que les lettres extrémales acquièrent
dans la perception des mots un statut particulier de « clefs » que Pierre Courrieu 50
le scripteur produisant des abréviations utiliserait, mais ceci
est très spéculatif.
Les aspects évoqués ci-dessus ne sont pas les seuls détermi
nants envisageables en ce qui concerne le choix des lettres pour
une abréviation. En effet, un mot ne se réduit pas à une simple
concaténation de lettres. Il peut contenir différentes sortes d'unités
dont certaines, comme les syllabes, sont plus particulièrement
repérables dans la forme orale du mot, alors que d'autres, comme
les morphèmes, relèvent, en tant que plus petites unités por
teuses de sens, de l'interface forme écrite / signification lexicale.
Différentes études concernant les processus de lecture laissent
entrevoir, de façon d'ailleurs très nuancée, que la syllabe et/ou
le morphème pourraient jouer un certain rôle dans l'analyse des
suites de lettres et l'identification des mots (Spoehr et Smith,
1973 ; Pynte, 1974 ; Pynte et Masselot, 1980 ; Murrel et Morton,
1974 ; Lima et Pollatsek, 1983 ; Pavard, 1983 ; Segui et Zubi-
zarreta, 1985 ; Lima, 1987 ; Holmes et O'Regan, 1987). On peut
alors également s'interroger sur la pertinence de ces unités en ce
qui concerne les processus de production. Supposons en effet
que la représentation mentale d'un mot utilise une structuration
syllabique ou morphémique, on pourrait alors s'attendre à
trouver une forme de marquage de la structure dans les abrévia
tions produites par un scripteur. Il reste à savoir justement
quelle forme pourrait bien prendre un tel marquage. Il faut
bien dire que nous sommes assez démunis à ce sujet, faute
d'observations adéquates, et que l'on est pour l'instant réduit
à des conjectures plus ou moins hasardeuses. Nous avons pour
notre part retenu l'hypothèse que le marquage de la structure
pourrait se faire par une reproduction particulièrement syst
ématique des initiales des unités pertinentes. Cette supposition
n'a rien de nécessaire et se base intuitivement sur une générali
sation de l'usage ordinaire qui est de retenir l'initiale des mots
ou des noms propres comme abréviation minimale.
EXPÉRIENCE
MÉTHODE
Sujets
40 étudiants ayant le français pour langue maternelle ont participé
à l'expérience. Stratégies d'abréviation 51
Matériel
On a constitué une liste de 24 mots de la langue française servant
d'items tests, la moitié des sujets travaillant sur la liste directe et l'autre
moitié travaillant sur une liste en ordre inverse. Dans les deux cas, la
liste test est précédée par 4 items d'entraînement. Tous les mots sont
trisyllabiques et longs de 8 lettres (minuscules avec les diacritiques
nécessaires) dont 4 consonnes et 4 voyelles. Sur l'ensemble de la liste,
11 y a pour chacune des 8 positions possibles dans les mots autant de
cas où la lettre est une consonne que de cas où c'est une voyelle, soit
12 occurrences de chaque type de lettre par position pour la liste test
(les items d'entraînement respectent les mêmes équilibres). La moitié
des tests sont utilisés pour une sous-expérience particulière. Il
s'agit des 12 mots dont la troisième lettre est une voyelle. Ces mots sont
répartis en 4 catégories, à raison de 3 items par catégorie, suivant le
statut de la troisième lettre. Cette lettre peut être, ou ne pas être,
une initiale syllabique, et elle peut d'autre part être, ou ne pas
une morphémique. Il est à noter que lorsque la troisième lettre
est une initiale morphémique, c'est la première lettre d'un mot que l'on
peut aussi trouver à l'état libre dans la langue et qui est ici précédé
d'un préfixe (ex. réemploi). Les 12 items de cette sous-expérience sont
regroupés soit en première moitié, soit en seconde moitié de la liste des
items tests, suivant que l'ordre de la liste est direct ou inverse.
Un protocole de réponse comporte, en première page, une consigne
détaillée, et en seconde page l'ensemble des items. La liste des items
apparaît dans une première colonne, intitulée « mot », ainsi que dans une
seconde colonne, intitulée « marquage », mais où les mots sont présentés
dans un format laissant plus d'espace entre les lettres pour permettre
au sujet de les cercler aisément. Une troisième colonne est intitulée
« abréviation » et est laissée vide.
Consigne
Les sujets ont pour consigne de trouver pour chaque mot une abré
viation aussi évocatrice que possible du mot et longue de 5 lettres
exactement. Aucun caractère étranger au mot ne doit être employé.
Le sujet doit écrire l'abréviation dans la colonne « abréviation » en
regard du mot, puis cercler les lettres correspondantes sur le format
espacé du mot dans la colonne « marquage », ceci pour éviter toute
ambiguïté à la lecture des protocoles. L'usage d'un brouillon est permis.
Chaque sujet remplit un protocole individuellement en un temps qui
n'est pas limité, mais qui est généralement de l'ordre d'une quinzaine
de minutes.
Remarque
Un examen de la liste des mots tests présentée dans la section
« résultats » montrera que ces mots ne sont pas tous des mots d'usage 52 Pierre Courrieu
très fréquent. Ceci est simplement inévitable compte tenu des re
ssources très limitées qu'offre la langue pour manipuler des variables
expérimentales telles que celles que nous étudions ici. On aurait pu
craindre que la relative rareté de certains mots incite les sujets à faire
des abréviations plus longues, voire à ne pas abréger, s'ils en avaient
eu la liberté. C'est là précisément la raison pour laquelle la longueur
des est imposée, ce qui permet donc d'éliminer l'éventuel
biais lié à la fréquence. Mais il faut donc bien considérer que ce ne sont
pas des abréviations « naturelles » qui sont étudiées ici (l'étude linguis
tique de corpus d'abréviations convient bien mieux à un tel objectif).
Ce qu'on étudie ici, c'est un processus expérimentalement contrôlé
pour mettre à jour certains déterminants psycholinguistiques suscept
ibles d'intervenir, entre autres choses, dans la formation d'abréviations,
laquelle est donc ici le moyen au moins autant que le sujet de l'étude.
Variable dépendante
La variable dépendante est une variable binaire associée à chaque
lettre de chaque mot test, et qui vaut 1 si la lettre est reproduite dans
l'abréviation, ou 0 si la lettre est exclue de l'abréviation.
Toutefois, dans la sous-expérience portant sur le statut de la tro
isième lettre (initiale d'unité (s) ou non), seules les données concernant
cette sont prises en compte dans J'analyse.
Facteurs et plans d'analyse
Les données sont analysées suivant trois plans distincts permettant
de mettre en évidence différents aspects des résultats.
1. Profils d'abréviation des items :
Cette analyse utilise trois facteurs qui sont :
R : Rang de la lettre dans le mot : 8 modalités ;
I : Item (mot test) : 24 modalités ;
S : Sujet (aléatoire) : 40 modalités.
Le plan d'analyse est :
R8 ♦ 124 * S40.
2. Position et nature de la lettre :
Cette analyse utilise quatre facteurs qui sont :
O : Occurrence de lettre (aléatoire) : 192 modalités ;
L : nature de la Lettre : 2 modalités (Voyelle, Consonne) ;
R : Rang de la lettre dans le mot : 8 modalités ;
S : Sujet (aléatoire) : 40 modalités.
Le plan d'analyse est :
012 <L2 * R8> * S40. Stratégies d'abréviation 53
3. Statut de la troisième lettre relativement à la structure du mot :
Cette analyse utilise cinq facteurs qui sont :
I : Item (mot test, aléatoire) : 12 modalités ;
Y : statut Syllabique de la troisième lettre : 2 modalités (initiale
ou non) ;
M : statut Morphémique de cette lettre : 2 modalités (initiale ou non) ;
S : Sujet (aléatoire) : 40 modalités ;
G : Groupement des items : 2 modalités (Début de liste, Fin de
liste).
Le plan d'analyse est :
13 <Y2 * M2> * S20 <G2>.
Analyses statistiques
Les données sont soumises à l'analyse de la variance suivant les plans
indiques ci-dessus et différents sous-plans de ceux-ci.
Pour les analyses intégrant deux facteurs aléatoires, on a calculé les
rapports F relatifs à chacune des sources aléatoires possibles, ainsi que
les Quasi-F, formule F" (voir à ce sujet Winer, 1971 ; Wickens et
Kepple, 1983). Nos décisions sont fondées sur la probabilité de dépasse
ment de F" qui tient compte simultanément des différentes sources
aléatoires et qui est le test le plus sévère. Les autres rapports F sont
cependant également donnés pour que le lecteur puisse vérifier la cohé
rence de nos conclusions suivant les critères les plus usuels.
HYPOTHESES
Hl : Compte tenu de la redondance propre des lettres, on
peut s'attendre à ce que les voyelles soient moins fréquemment
reproduites que les consonnes dans les abréviations.
H2a : Si le processus de restauration de l'abréviation supposé
par le scripteur est de type séquentiel, alors l'utilisation de la
redondance séquentielle des lettres doit conduire à ce que la
probabilité de reproduction d'une lettre diminue en fonction de
son rang dans le mot source. Ceci doit se traduire par une forte
composante linéaire de régression de la fréquence des reproduct
ions sur le facteur rang de la lettre, avec une pente négative.
H26 : Si le scripteur adopte une stratégie d'encadrement du
mot (voir introduction), alors la fréquence de reproduction des
lettres doit dépendre du rang, suivant une fonction paire (relat
ivement au centre du mot) dont les minima sont dans la zone
mediale du mot (fonction en U, ou en W, etc.). Ceci doit se 1
54 Pierre Courrieu
traduire par la dominance de une ou plusieurs composantes de
régression polynomiale de degré pair (quadratique pour une
fonction en U) admettant des minima dans la zone mediale.
H3 : Si la structure syllabique est marquée dans l'abréviation
par l'initiale des unités, alors les initiales syllabiques doivent être
reproduites plus fréquemment que les lettres qui n'ont pas cette
propriété.
H4 : Si la structure morphémique est marquée dans l'abré
viation par l'initiale des unités, alors les initiales morphémiques
doivent être reproduites plus fréquemment que les lettres qui
n'ont pas cette propriété.
RÉSULTATS
1. Profils d'abréviation des items
Les fréquences de reproduction dans les abréviations des
différentes lettres de chaque mot test sont présentées dans le
tableau I. On trouve en premier lieu un effet général du rang de la
Tableau I. — Fréquences de reproduction dans les abré
viations des différentes lettres de chacun des 24 mots tests
Frequency of use, as shown in the abbreviations, of the
various letters contained in each of the 24 test words
HOT RANG: RI R2 R3 R4 R5 R6 R7 R8
réemploi 1.00 .50 .78 ,83 1.00 .65 .18 .08
.93 .80 inaction .83 ,88 .85 .13 .23 .38
.98 .88 réalisas .78 .85 .20 .50 .70 .10
.93 utopiste 1.00 .75 .83 .28 .40 .60 .23
.90 .58 dialcool .75 .65 .90 .53 .30 .40
.93 .78 inactuel .75 .93 .88 .23 .13 .40
.93 .80 néophyte .78 .90 ,83 .43 .35 .00
isophone .93 .90 .75 .90 .88 .28 .25 .10
coenzyae .95 .80 .70 .70 .93 .50 .35 .08
inusable .90 .85 .73 .95 .45 .65 .33 .15
géomètre .98 .88 .83 .80 .18 .75 .35 .25
uniforae .90 .78 .60 .95 .58 .40 .63 .15
escalier .70 .98 .98 .63 .80 .33 .28 .33
dégauchi .93 .35 1 .00 .53 .45 .68 .68 .43
novateur 1.00 .85 1 .00 .45 .73 .20 .13 .68
coquelet .80 .98 ,15 .15 .73 .50 .70
insoumis .85 .78 .98 .55 .48 .70 .48 .20
ondoyant .95 .83 1 .00 .50 .80 .20 .23 .50
comateux 1.00 .83 .98 .73 .73 .18 .10 .48
dépourvu .95 .50 .95 .33 .30 .68 .78 .53
engourdi .78 .73 1 .00 .30 .30 .63 .80 .48
ablation .98 .95 .98 .53 .75 .08 .23 .48
solarium .95 .83 .98 .50 .80 .08 .33 .55
intuitif .83 .80 .85 .45 .43 .60 .38 .70 Stratégies d'abréviation 55
lettre dans le mot, effet qui est significatif relativement aux
items (Fi(7, 161) = 26,16, p < .001), relativement aux sujets
(Fs(7,273) = 65,57, p < .001), et aux deux popul
ations (F" (7,288) = 18,76, p < .001). Cet effet sera analysé plus
en détail dans la section suivante. Cependant, si l'on considère
comme systématique le facteur Item, on peut constater que les
profils d'abréviation des différents mots se différencient dans
l'ensemble de façon systématique, l'interaction entre le rang de la
lettre et les items étant significative relativement aux sujets
(Fs(161,6279) = 11,18, p < .001). En somme, il existe un effet
général du rang de la lettre, mais cet effet est modulé par d'autres
déterminants qui contribuent à différencier sensiblement les
profils d'abréviation des différents mots.
2. Position et nature de la lettre
Les fréquences de reproduction des lettres suivant leur posi
tion dans le mot et suivant leur nature (voyelle ou consonne)
sont présentées dans le tableau II. La fréquence de reproduction
des consonnes est signifîcativement plus importante que celle
des voyelles (Fo(l,176) = 190,33, p < .001, Fs(l,39) = 90,99,
p < .001, F"(l,81) = 61,62, p < .001), ce qui confirme l'hypo
thèse Hl. Comme il a été signalé dans l'analyse précédente, le
rang de la lettre dans le mot a un effet globalement significatif
qui ressort également de la présente analyse (Fo(7,176) = 65,69,
p < .001, Fs(7,273) = 65,57, p < .001, F"(7,428) = 32,90,
p < 001). On trouve également une interaction significative
entre la nature et le rang de la lettre (Fo(7,176) = 5,42, p < .001,
Fs(7,273) = 17,38, p < .001, F"(7,285) = 4,27, p < .001).
Tableau IL — Fréquence de reproduction des lettres dans
les abréviations en fonction de la nature (voyelle ou consonne)
et du rang de la lettre dans le mol
Frequency of use of letters, as shown in the abbreviations,
as a function of the nature (vowel or consonant) and of the
rank of these letters in the word
RANG Rl R2 R3 R4 R5 R6 R7 R8
NATURE
Voyellt .88 .71 .75 .47 .38 .26 .27 .21 .49
Consonne .96 .85 .97 .85 .84 .61 .50 .48 .76
.92 .78 .86 .66 .61 .44 .39 .35

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.