640 homophones et leurs caractéristiques - article ; n°4 ; vol.99, pg 687-708
23 pages
Français

640 homophones et leurs caractéristiques - article ; n°4 ; vol.99, pg 687-708

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
23 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

L'année psychologique - Année 1999 - Volume 99 - Numéro 4 - Pages 687-708
22 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Informations

Publié par
Publié le 01 janvier 1999
Nombre de lectures 72
Langue Français

Extrait

Ludovic Ferrand
640 homophones et leurs caractéristiques
In: L'année psychologique. 1999 vol. 99, n°4. pp. 687-708.
Citer ce document / Cite this document :
Ferrand Ludovic. 640 homophones et leurs caractéristiques. In: L'année psychologique. 1999 vol. 99, n°4. pp. 687-708.
doi : 10.3406/psy.1999.28503
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1999_num_99_4_28503L'Année psychologique, 1999, 99, 687-708
NOTE MÉTHODOLOGIQUE
Laboratoire de Psychologie expérimentale
CNRS URA 316, EPHE,
Université René-Descartes, Paris F1
640 HOMOPHONES
ET LEURS CARACTÉRISTIQUES
par Ludovic FERRAND
SUMMARY : 640 French homophones and their characteristics.
Homophones have interesting linguistic properties that make them useful
in many experiments involving language. This paper presents a set of
640 homophones and their statistical properties. Statistics include word
frequency, number of orthographic neighbors, and bigram frequency. Also, we
provide the phonological form and the syntactic category for each homophone.
Key words : homophones, norms, word recognition.
INTRODUCTION
Les homophones se définissent comme des mots se pronon
çant exactement de la même façon mais qui ne partagent pas la
même orthographe et la signification (par ex. SOT, SEAU,
SAUT, SCEAU). Les homophones ne doivent pas être confondus
avec les homographes, qui correspondent à des mots partageant
la même orthographe mais ayant plusieurs sens (par ex. LOUER
un appartement, et LOUER un dieu). La plupart du temps, les
homographes sont homophones (c'est-à-dire qu'ils se prononc
ent de la même façon), mais certains homographes sont parfois
1. 28, rue Serpente, 75006 Paris. E-mail:ferrand@psycho. univ-paris5.fr. 688 Ludovic Ferrand
hétérophones (par ex. un fils /fis/ et des fils /fil/). Contrairement
à l'intuition, les homophones ne constituent pas une classe obs
cure d'items linguistiques. Au contraire, les homophones sont
intéressants de par leur abondance en français (environ 1 200 en
comptant les formes verbales1 ; Bertrand, 1990). Par ailleurs, ils
constituent un défi aux modèles de l'identification des mots
écrits, ainsi qu'aux modèles de prononciation (Grainger et Fer
rand, 1994, 1996). Les homophones sont largement utilisés en
Psycholinguistique, que ce soit pour l'étude de l'accès au lexique
dans la reconnaissance visuelle des mots (Ferrand, 1995 ; Fer
rand et Grainger, 1996 ; Grainger et Ferrand, 1994 ; McRae,
Jared, et Seidenberg, 1990 ; Rubenstein, Lewis, et Rubenstein,
1971 ; Van Orden, 1987) ou au cours de la production de la
parole (Dell, 1988 ; Ferrand, 1997 ; Ferrand, Segui, et Grainger,
1995 ; Ferrand, Humphreys, et Segui, 1998 ; Jescheniak et
Levelt, 1994).
En anglais, il existe déjà plusieurs recueils d'homophones
(voir en particulier Whitford, 1966, et Ferreira et Cutting,
1997)2.
En français, il n'existe aucune norme de fréquence publiée
pour les homophones. Nous pensons que nos tables seront utiles les chercheurs qui désirent utiliser des homophones. Nous
reportons les caractéristiques de 640 homophones.
METHODE
Le corpus de mots utilisés est la base de données informatisée
Brulex développée par Content, Mousty, et Radeau (1990). Bru-
lex contient 35 746 entrées lexicales ; ce corpus a été créé
en 1986 en sélectionnant la majeure partie des mots listés dans le
Dictionnaire Micro-Robert (Robert, 1986). Les noms propres et
les affixes sont exclus. Les verbes sont représentés sous leur
forme infinitive seulement. La forme féminine des noms et des
1. Les 1 200 homophones répertoriés par Bertrand (1990) comprennent les
formes verbales. Nous avons décidé de ne pas inclure ces formes verbales dans
notre article, car ces dernières ne sont pas disponibles dans Brulex.
2. Voir également sur Internet : http://dasparc.cogsci.uiuc.edu/~jcut-
ting/homophones.html, ainsi que : http://www.finifter.com/tracy/homo-
nym.html. 640 homophones et leurs caractéristiques 689
adjectifs est représentée séparément. Pour chaque mot, une
information différente est disponible, comme la forme orthogra
phique, la forme phonologique, la classe grammaticale, la fr
équence d'occurrence, la valeur d'imagerie, le nombre de lettres,
de phonèmes, de syllabes, d'homographes, d'homophones et de
sens. Les fréquences d'occurrences dans Brulex sont extraites du
corpus du Trésor de la langue française (Imbs, 1971). Ce corpus
contient 23,5 millions de mots sélectionnés parmi une large
gamme de livres publiés entre 1919 et 1964 (il s'agit de romans,
d'essais, de recueils de poèmes et œuvres dramatiques).
Nous n'avons retenu que les caractéristiques suivantes : la
forme phonologique (d'après Warnant, 1987), la catégorie gramm
aticale, la fréquence d'occurrences, le nombre de voisins ortho
graphiques, ainsi que la fréquence des digrammes. Les caracté
ristiques des 640 homophones sont présentées dans le tableau I.
Dans le tableau II, nous présentons la liste des abréviations
concernant la catégorie grammaticale.
La fréquence d'occurrences introduites dans ces tables est
reprise des tables publiées par le Centre de recherche pour un
trésor de la langue française (Imbs, 1971). Elle représente le
nombre d'occurrences d'un mot rapporté à un total de 100 mil
lions. Selon la définition établie par Coltheart, Davelaar, Jonas-
son, et Besner (1977), les voisins orthographiques d'un mot
donné correspondent à tous les mots de même longueur qui diffè
rent par une lettre seulement, toutes les lettres communes res
tant aux mêmes positions (par ex. le mot BAC a pour voisins
orthographiques LAC, SAC, BEC, BIC, BAR, BAL, etc.). Les fréquenc
es des digrammes correspondent aux moyennes des logarithmes
décimaux des fréquences textuelles de tous les digrammes cons
tituant le mot (voir Content et Radeau, 1988). Cette mesure
donne une indication du degré de régularité séquentielle de la
forme orthographique. 690 Ludovic Ferrand
TABLEAU I. — Normes pour 640 homophones
Norms for 640 homophones
Forme Orthographique Forme Phonologique Catégorie Fréquence N Digrammes
aile /El/ n.f. 11 6883 3.01
elle /el/ pronom 693928 1 3.23
ailé /de/ adj. 2 531 2.39
héler /•ele/ V. 361 2 2.64
aine /en/ n.f. 123 7 3.03
haine /W n.f. 8202 5 3.04
air /er/ n. m. 58360 2 3.12
aire /er/ n. f. 999 12 3.18
ère /er/ n. f. 884 2 1.97
n. m. hère /•er/ 59 3 1.31
haleine /alen/ n.f. 2352 1 2.84
alêne n.f.
allée /aie/ n.f. 4688 1 2.56
aller /aie/ V. 216341 0 3.15
haler /aie/ V. 170 5 2.97
interj. 1 allô /alo/ 2.16
/"alo/ n. m. 2 halo 608 1.92
amande /amând/ n.f. 404 2 3.03
amende n.f. 378 2 3.12
amen /amen/ n. m. 272 2 2.90
amène adj. 38 2 1.48
an /a/ n. m. 52855 6 4.61
en /a/ prép. 5 6.64
en /à/ pron. 5 6.64
ancre /ânkr/ n.f. 612 3 2.87
encre n.f. 1825 2 3.10
antre /ântr/ n. m. 280 4 3.22
2 entre prép. 93254 3.45
appas /apa/ n. m. 0 2.61
n. m. appât 399 0 1.37
apprêt /âpre/ n. m. 246 0 2.24
après prép. 90085 1 1.30 /âpre/ adv. 1 1.30
art /ar/ n. m. 24585 2 2.59
are /ar/ n. m. 216 7 3.25
arrhes /ar/ n.f. 25 0 2.25
(') Fréquence (d'après Brulex) ; N (nombre de voisins orthographiques)
— (fréquence non répertoriée dans Brulex). 640 homophones et leurs caractéristiques 691
Tableau I (suite)
Forme Orthographique Forme Phonologique Catégorie Fréquence Digrammes
eau loi n. f. 36625 2.31
haut l'ol adj. 2.56
l'ol haut n. 41539 2.56
os loi n. m. 3050 3.34
ho! l'ol interj. 23581 4.05
oh! loi 0.00
au, aux loi art. 0.00
ô loi interj. 0.00
hôtel /otel/ n. m. 12954 0 2.19
autel n. m. 2220 0 2.91
auteur /otœr/ n. m. 11912 4 3.12
/otcer/ hauteur n.f. 6704 1 2.88
- /ba/ adj. bas 15 2.70
/ba/ n. m. 21122 15 2.70
/ba/ n. m. 72 3 0.80
bah! /ba/ interi. 1208 1.41 6
balle /bal/ n.f. 3799 8 2.96 bal n. m. 1859 12 2.50
balade /balad/ n. f. 85 2 2.72 199 ballade n. f. 0 2.79
balai /baie/ n. m. 723 0 2.42
ballet n. m. 782 3 2.93
4786 banc /bâV n. m. 0 2.62
/bä/ n. m. 242 ban 10 2.27
bar /bar/ n. m. 2173 8 2.58
barre n.f. 2225 6 2.95
basilique /bazilik/ n.f. 293 0 2.77
basilic n. m. 76 0 2.43
beau Ibol adj. 3 2.59
beau Ibol n. 74063 3 2.59
baud Ibol n. m.
bot Ibol adj. 25 14 2.34
baux Ibol n. m. 246 3 2.57
- bon Ibol adj. 15 3.06
bon Ibôl n. m. 53493 15 3.06
bond Ibol n. m. 2365 5 2.83
/buj

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents