Réflexions sur les méthodes quantitatives en domaine littéraire - article ; n°42 ; vol.21, pg 89-100
13 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Réflexions sur les méthodes quantitatives en domaine littéraire - article ; n°42 ; vol.21, pg 89-100

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
13 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Médiévales - Année 2002 - Volume 21 - Numéro 42 - Pages 89-100
L'informatique rend plus aisée, mais aussi plus dangereuse, l'utilisation des méthodes quantitatives en domaine littéraire. On montre d'abord les éléments textuels qui se prêtent à un traitement quantitatif. À cette occasion, on montre les avantages d'une lemmatisation partiellement automatisée et adaptée aux particularités orthographiques du Moyen Âge. On expose ensuite les profits qu'on peut attendre d'un tel traitement, en insistant sur le fait qu'ils ne sont pas automatiques. Enfin, on passe en revue quelques méthodes statistiques, en en dégageant les traits essentiels et en insistant sur la nécessité d'en connaître les caractéristiques pour éviter les utilisations inappropriées.
On the Use of Quantitative Methods in Literary Studies - The existence of computer programs makes easier, but more dangerous, the application of quantitative methods to literary texts. In this article are first shown the textual features that lend themselves to quantitative treatments. On this occasion are expounded the advantages of the use of a partially automatic lemmatization that takes into account the peculiarities of the spelling of the Middle Ages. Then are explained the benefits that could result from such treatments, with particular emphasis on the fact that these benefits are not self-acting. Finally, some statistical methods are described and the necessity is underlined of knowing the particulars of these methods to avoid unsuitable applications.
12 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Informations

Publié par
Publié le 01 janvier 2002
Nombre de lectures 35
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

Monsieur Étienne Évrard
Réflexions sur les méthodes quantitatives en domaine littéraire
In: Médiévales, N°42, 2002. pp. 89-100.
Résumé
L'informatique rend plus aisée, mais aussi plus dangereuse, l'utilisation des méthodes quantitatives en domaine littéraire. On
montre d'abord les éléments textuels qui se prêtent à un traitement quantitatif. À cette occasion, on montre les avantages d'une
lemmatisation partiellement automatisée et adaptée aux particularités orthographiques du Moyen Âge. On expose ensuite les
profits qu'on peut attendre d'un tel traitement, en insistant sur le fait qu'ils ne sont pas automatiques. Enfin, on passe en revue
quelques méthodes statistiques, en en dégageant les traits essentiels et en insistant sur la nécessité d'en connaître les
caractéristiques pour éviter les utilisations inappropriées.
Abstract
On the Use of Quantitative Methods in Literary Studies - The existence of computer programs makes easier, but more
dangerous, the application of quantitative methods to literary texts. In this article are first shown the textual features that lend
themselves to quantitative treatments. On this occasion are expounded the advantages of the use of a partially automatic
lemmatization that takes into account the peculiarities of the spelling of the Middle Ages. Then are explained the benefits that
could result from such treatments, with particular emphasis on the fact that these benefits are not self-acting. Finally, some
statistical methods are described and the necessity is underlined of knowing the particulars of these methods to avoid unsuitable
applications.
Citer ce document / Cite this document :
Évrard Étienne. Réflexions sur les méthodes quantitatives en domaine littéraire. In: Médiévales, N°42, 2002. pp. 89-100.
doi : 10.3406/medi.2002.1541
http://www.persee.fr/web/revues/home/prescript/article/medi_0751-2708_2002_num_21_42_1541Médiévales 42, printemps 2002, p. 89-100
Etienne EVRARD
RÉFLEXIONS SUR LES MÉTHODES QUANTITATIVES
EN DOMAINE LITTÉRAIRE
Les opérations quantitatives sur les textes littéraires ont commencé très tôt :
que l'on pense au décompte de mots, qui s'est pratiqué fort anciennement, avec
pour but de permettre de déceler des omissions ou des interpolations. Mais on
peut difficilement voir dans ces pratiques des méthodes proprement statist
iques; leur intérêt est purement pratique. Ce n'est guère qu'au XIXe siècle
qu'apparaissent des traitements quantitatifs visant à mettre en évidence des
caractères constitutifs des textes. Encore sont-ils généralement assez pauvres
en raison du peu de développement de la statistique à cette époque. Sans
méconnaître les mérites de tentatives antérieures, on est amené à dire que la
statistique littéraire et linguistique a reçu une impulsion décisive lorsque le
statisticien anglais G. U. Yule a élaboré et publié son livre The Statistical Study
of Literary Vocabulary, paru en 1944. Il s'y intéresse à V Imitation de Jésus-
Christ, texte d'attribution douteuse pour lequel les diverses hypothèses énon
cées lui paraissaient étayées sur des arguments inconsistants, dont certains,
même, allégués par tel chercheur en faveur d'une hypothèse, l'étaient par tel
autre en faveur d'une hypothèse différente, inconciliable avec la première. Il se
demandait si les méthodes quantitatives, plus rigoureuses, ne donneraient pas
plus de sérieux à la recherche, non qu'il escomptât arriver à des certitudes (ce
que la statistique ne donne jamais ; elle se contente de donner des idées) mais
parce que les résultats sont exprimés en termes quantitatifs, ce qui leur donne
plus d'objectivité, et que, de plus, ils sont habituellement pourvus d'évaluat
ions en termes de probabilités, ce qui permet de les utiliser à meilleur escient.
Avant de décider d'entrer dans cette voie, il me paraît indispensable de
réfléchir à trois questions préjudicielles. Tout d'abord, les données des textes
littéraires se prêtent-elles aux traitements quantitatifs, et, éventuellement, à
quelles conditions ? Deuxièmement, si la réponse à cette question est positive,
quels profits peut-on en attendre? Enfin, comment opérer et selon quelles
méthodes ? 90 É. EVRARD
Ici, il convient de s'arrêter à une considération importante. Pendant long
temps, les littéraires ont hésité à se lancer dans les traitements quantitatifs parce
qu'ils craignaient la complexité des calculs et se sentaient incompétents. Mais
maintenant qu'ils disposent de logiciels capables d'exécuter les traitements
choisis pourvu qu'on leur fournisse les données (lesquelles sont, dès à présent,
stockées en grand nombre dans les mémoires d'ordinateurs), certains se
risquent à appliquer, sans en connaître ni les détails ni les particularités, des
traitements pour lesquels ils font pleine confiance à la machine. Cette
confiance n'est pas déraisonnable : les logiciels exécutent exactement les tests
qu'on leur demande. Mais, lors du choix même des tests puis de l'interprétation
des résultats, la méconnaissance des opérations réalisées peut conduire l'inter
prète humain aux pires erreurs. Il est donc indispensable que l'utilisateur
connaisse bien les tests qu'il emploie, du moins quant à la nature des trait
ements qu'ils font subir aux données, de manière à en évaluer correctement les
effets et la signification l.
Textes littéraires et étude statistique
Quant à la première question préjudicielle, il convient de dire que les textes
littéraires offrent un terrain de choix aux études statistiques. Celles-ci, en effet,
s'exercent sur des ensembles dont les éléments peuvent être mesurés, ordonnés
ou dénombrés : les données ainsi obtenues, toutes numériques, sont la matière
à laquelle s'appliquent les traitements quantitatifs. Or, les textes regorgent
d'éléments mesurables, dénombrables ou susceptibles d'être rangés et mis en
ordre. On peut mesurer chaque occurrence textuelle en nombre de phonèmes
ou de graphèmes, chaque phrase en nombre de mots ou de syntagmes, chaque
vers en nombre d'occurrences verbales, etc. : il s'agit là de variables cardinales,
c'est-à-dire mesurées par un nombre. De leur côté, les variables nominales,
dont la caractérisation est toute qualitative, peuvent faire l'objet de dénombre
ments indiquant des effectifs, ce qui ouvre la voie à des traitements quantitat
ifs : il n'y a aucune relation quantitative entre les diverses catégories grammati
cales, par exemple, mais il y en a entre leurs effectifs dans tel texte. Outre les
catégories grammaticales, on citera, comme variables de ce type, les effectifs
des divers vocables, ceux des différents types morphologiques (cas, nombres,
modes, temps, voix) et des structures syntaxiques, etc. Les mesures relatives
aux variables de ces deux types peuvent en outre être classées en ordre crois
sant (ou décroissant) : on les transforme ainsi en variables ordinales ; en un
certain sens, il y a là une perte d'information, mais il arrive que la constance ou
la variabilité d'un ordre de classement en dise plus que les écarts entre les
1. Je signale ici les logiciels Hyperbase, d'Etienne BRUNET et Estela, de S. MELLET et
Y. Deschamps, sur lesquels des informations peuvent être obtenues à « Bases, corpus et langage »,
INaLF (CNRS), Faculté des Lettres de Nice, 98 bd Herriot, F-06204 Nice, ainsi que le logiciel
Statistica, StatSoft France (1997), Statistica pour Windows, 31 cour des Juilliottes, F-94700
Maisons- Alfort. Dans la suite des notes, on trouvera aussi mention de logiciels du L.A.S.L. A., avec
les indications nécessaires en vue de leur utilisation. RÉFLEXIONS SUR LES MÉTHODES QUANTITATIVES
éléments classés, comme je m'en suis aperçu en étudiant la fréquence des diffé
rentes voyelles dans la prose latine antique 2. Il faut ajouter que, dans certaines
recherches (par exemple dans l'analyse des réponses à des enquêtes qui demand
ent de classer certains objets par ordre de préférence), on ne dispose que de
données ordinales. Il est clair que le traitement quantitatif d'une variable ordi
nale diffère de celui d'une variable cardinale ou nominale. Il convient donc, dès
le départ, de s'interroger sur la nature de la variab

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents