Gulliver et la machine à compter : une étude de spécificités - article ; n°1 ; vol.53, pg 145-157
14 pages
Français

Gulliver et la machine à compter : une étude de spécificités - article ; n°1 ; vol.53, pg 145-157

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
14 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

XVII-XVIII. Bulletin de la société d'études anglo-américaines des XVIIe et XVIIIe siècles - Année 2001 - Volume 53 - Numéro 1 - Pages 145-157
13 pages

Informations

Publié par
Publié le 01 janvier 2001
Nombre de lectures 17
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

Anne Bandry-Scubby
Gulliver et la machine à compter : une étude de spécificités
In: XVII-XVIII. Bulletin de la société d'études anglo-américaines des XVIIe et XVIIIe siècles. N°53, 2001. pp. 145-
157.
Citer ce document / Cite this document :
Bandry-Scubby Anne. Gulliver et la machine à compter : une étude de spécificités. In: XVII-XVIII. Bulletin de la société d'études
anglo-américaines des XVIIe et XVIIIe siècles. N°53, 2001. pp. 145-157.
http://www.persee.fr/web/revues/home/prescript/article/xvii_0291-3798_2001_num_53_1_1601GULLIVER ET LA MACHINE A COMPTER :
UNE ÉTUDE DE SPÉCIFICITÉS
... he had emptyed the whole Vocabulary into his Frame, and made the strictest
Computation of the general Proportion there is in Books between the Numbers
of Particles, Nouns, and Verbs, and other Parts of Speech.1
Le principe de la machine à écrire les livres de Lagado consiste à
tenter de produire un discours cohérent par le hasard. L'écriture
automatique, qu'elle soit humaine ou mécanique, donne pour le moment
surtout de l'incongru. En revanche, la machine à compter aide à déceler
un certain nombre des moyens stylistiques qui sous-tendent un texte pris
comme un produit fini. L'analyse textuelle assistée par ordinateur permet
d'affiner des impressions de lecture. Dans sa grande étude A Quantitative
Approach to the Style of Jonathan Swift, Louis Tonko Milic cherche à
établir la signature stylistique de en déterminant un nombre
suffisant d'invariants de l'écriture pour qu'émerge un profil
reconnaissable. Postulant que l'auteur d'un texte adapte le vocabulaire et
la rhétorique à l'effet qu'il veut produire, alors qu'une partie des choix
grammaticaux sont inconscients, Milic élabore des mesures telles que
"the stable style statistic," combinaisons de taux de fréquence et de
cooccurrence qui permettent effectivement de distinguer Swift de certains
de ses contemporains.2 Le but ici est beaucoup plus modeste: il ne s'agit
pas d'appréhender l'écriture de Swift de manière générale, mais de
comparer les quatre parties de Gulliver's Travels en examinant le
1. Jonathan Swift, Gulliver's Travels, 1726 (Oxford: Oxford World's Classics, 1998)
176-77. Les références seront désormais données dans le texte. Édition électronique (un
toilettage est nécessaire): Project Gutenberg. Based on the 1735 Faulkner edition. 29
octobre 2000. <ftp://ibiblio.org/pub/docs/books/gutenberg/etext97/gltrvlO.txt>.
2. Voir Louis T. Milic, A Quantitative Approach to the Style of Jonathan Swift (The
Hague: Mouton, 1967). ANNE BANDRY 146
vocabulaire spécifique de chacune d'entre elles à partir de l'analyse des
spécificités fournie par le programme Hyperbase.3
Les quelques 104 000 mots (ou occurrences) qui forment les quatre
Voyages de Gulliver se répartissent comme suit:4
Gl G2 G3 G4
Occurrences 23 780 27 031 23 524 28 755
% de GT 23% 26% 23% 28%
Si la mesure de la richesse du vocabulaire est toujours problématique, il
semble loisible ici d'en donner une approximation par un taux très simple
en raison de la ressemblance des quatre éléments comparés.5 Le nombre
de vocables (ou mots différents) rapporté au nombre d'occurrences (ou
nombre total de mots) confirme l'intuition que le troisième Voyage a un
vocabulaire plus varié que les autres:
Gl G2 G3 G4
4 168 Vocables 3 601 3 945 4 033
Voc/occ 0,151 0,146 0,171 0,145
Si le troisième Voyage était écrit comme les trois autres (ce que l'on peut
simuler en lui appliquant un taux de 0,147), on attendrait 15% de
vocables (ou 575) en moins. Il comprend sensiblement le même nombre
3. Etienne Brunet, Hyperbase, logiciel hypertexte pour le traitement documentaire et
statistique des corpus textuels, CD-ROM, version Windows 2.0 (INALF, 1998).
4. Les lettres du début, "A LETTER from Capt. Gulliver, to his Cousin Sympson" et
"THE PUBLISHER TO THE READER" ont été exclues du décompte. Elles sont
composées de 1 955 mots (occurrences), soit un nombre comparable aux 2 322 mots du
dernier chapitre du quatrième Voyage. Les quatre Voyages sont désignés respectivement
parGl,G2, G3etG4.
5. Comme le souligne André Cossette dans La Richesse lexicale et sa mesure (Paris:
Champion, 1994), "le nombre de formules ou indices qui ont été proposés depuis 40 ans
pour mesurer la richesse lexicale laisse soupçonner un problème complexe" (4). Mais
"quand deux textes sont de la même longueur, on considère que la seule mesure du
nombre de vocables est suffisante pour déterminer le plus riche des deux" (4). Cossette,
qui travaille dans le sillage de Charles Muller, prend "vocable" dans le sens d'"entrée au
dictionnaire," ce qui implique une lemmatisation du corpus. Hyperbase rend la
lemmatisation possible lors de recherches sur des mots précis, mais ne la propose pas de
manière systématique: dans cet article, "vocable" signifie donc "forme" et ne suppose pas
de lemmatisation. Le taux voc/occ donné ci-dessus correspond à ce que les anglophones
appellent "type/token ratio." GULLIVER ET LA MACHINE À COMPTER 147
de vocables que le deuxième et le quatrième Voyages, environ 4 000,
alors qu'il est plus court.
Une autre estimation de la richesse est souvent donnée par le taux
d'hapax, ou termes qui n'apparaissent qu'une fois. Un excédent
comparable de 17% se retrouve entre le nombre de mots de fréquence 1
observés dans la troisième partie et celui obtenu en appliquant le taux
commun aux trois autres parties.6 L'hétérogénéité des situations
auxquelles est confronté Gulliver dans le troisième Voyage repose
effectivement sur un vocabulaire plus diversifié et un plus grand nombre
de mots qui ne sont pas repris à l'intérieur de cette partie. Un excédent
plus fort encore apparaît si l'on considère les 3 588 hapax de l'ensemble
de Gulliver's Travels: le troisième Voyage en comprend 22% de plus que
ne laisserait attendre sa taille. Le déficit correspondant se situe
principalement dans le premier Voyage (-18%).7 L'ordre d'écriture des
quatre Voyages transparaît ici: la partie rédigée en dernier comporte le
vocabulaire le plus varié, le plus grand nombre de mots nouveaux et
uniques, par lesquels s'exprime une défamiliarisation différente des
précédentes. Le resserrement du vocabulaire dans le Voyage donné à lire
en dernier accroît donc l'étrangeté pour le lecteur à travers l'expérience de
Gulliver: l'un et l'autre doivent s'ajuster à un monde étroit, dont le
vocabulaire paraît d'autant plus compact que celui de la partie précédente
était dispersé. Écrire "la chose qui n'est pas" au lieu de "mensonge" active
un plus grand nombre d'occurrences mais n'apporte pas de mot nouveau
(la moitié des 46 occurrences de "thing" se trouvent dans le quatrième
Voyage, dont 6 dans la combinaison citée).
En outre, le troisième Voyage comprend plus de noms; le taux de
"the" et de "of permet d'en donner une approximation sans toutefois
mesurer précisément la proportion de substantifs.8 L'excédent de 10,5%
par rapport au taux attendu en fonction de la taille se reflète sans surprise
dans un déficit équivalent au quatrième Voyage (-10,3%); le même
phénomène se produit entre les deux premières parties (+6% pour la
première et -7% pour la deuxième ). Selon la théorie du langage en vogue
6. Gl, G2 et G4 comprennent en moyenne 7,7% d'hapax (respectivement 1 876,
2 099 et 2 184). G3 en contient 2 175, soit 9,25% du total de ses occurrences.
7. Sur les 3 588 hapax de GT, 1 024 appartiennent au troisième Voyage alors qu'on
en attendrait 800 (excédent de 22%); le premier Voyage en comprend 750 alors qu'on en 882 en fonction de la taille (déficit de 18%).
8. Voir Milic and Steve Slane, "Quantitative Aspects of Genre in the Century of
Prose Corpus," Style 28.1 (1994): 42-54. H faudrait avoir recours à un analyseur
syntaxique pour pouvoir tirer des conclusions plus précises. Dans A Quantitative
Approach to the Style of Jonathan Swift, Milic signalait l'absence de stabilité du taux de
noms dans Gulliver's Travels (159). ANNE BANDRY 148
à Lagado, les noms en sont les seuls éléments indispensables ("because in
Reality all things imaginable are but Nouns" [177]). Swift semble
s'inscrire dans une longue tradition

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents