Pourquoi (et comment) l historien doit-il compter les mots ? - article ; n°1 ; vol.4, pg 81-105
27 pages
Français

Pourquoi (et comment) l'historien doit-il compter les mots ? - article ; n°1 ; vol.4, pg 81-105

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
27 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Histoire & Mesure - Année 1989 - Volume 4 - Numéro 1 - Pages 81-105
Alain GUERREAU. Why (and how) must historian count words ? The proceedings of the international conference held in Nice in June 1985 on quantitative and computer methods for the study of texts display
Alain GUERREAU. Pourquoi (et comment) l'historien doit-il compter les mots ? Les actes du colloque international de Nice en juin 1985 sur les méthodes quantitatives et informatiques dans l'étude des textes manifestent une grande hétérogénéité des communications faites et montrent l'urgence pour l'historien d'étudier les fréquences dans leur variabilité ainsi que les structures sémantiques. La statistique lexicale dispose d'instrument pour étudier la variabilité des fréquences et d'abord la loi « rang-fréquence » (ou loi de Zipf) généralisée par B. Mandelbrot et qui peut également être considérée comme une loi de Pareto. Ceci veut dire que le système conceptuel est lui-même un objet fractal, ce qui ne devrait pas manquer de réactiver l'intérêt pour ce type de recherches. Quant aux études sur la variabilité des fréquences, elle manifestent qu'il n'y a pas adéquation avec un modèle hypergéométrique et donc qu'il faut tenir compte de la longueur du texte et du système propre de l'émetteur car parler est l'acte social par excellence. Pour étudier les structures sémantiques, le passage par l'utilisation des réseaux sémantiques semble indispensable et il reste à mettre au point les instruments informatiques qui, permettant de faire varier les valeurs des indices retenus, feront mieux saisir les relations entre texte et production de sens. L'historien a tout intérêt à confronter l'étude des constantes chiffrées d'un texte à l'étude de ses structures sémantiques : cette manière d'utiliser le texte, donnée fondamentale de l'historien, devrait lui ouvrir des horizons nouveaux.
25 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Informations

Publié par
Publié le 01 janvier 1989
Nombre de lectures 158
Langue Français
Poids de l'ouvrage 2 Mo

Extrait

Alain Guerreau
Pourquoi (et comment) l'historien doit-il compter les mots ?
In: Histoire & Mesure, 1989 volume 4 - n°1-2. pp. 81-105.
Citer ce document / Cite this document :
Guerreau Alain. Pourquoi (et comment) l'historien doit-il compter les mots ?. In: Histoire & Mesure, 1989 volume 4 - n°1-2. pp.
81-105.
doi : 10.3406/hism.1989.878
http://www.persee.fr/web/revues/home/prescript/article/hism_0982-1783_1989_num_4_1_878Résumé
Alain Guerreau. Pourquoi (et comment) l'historien doit-il compter les mots ?
Les actes du colloque international de Nice en juin 1985 sur les méthodes quantitatives et informatiques
dans l'étude des textes manifestent une grande hétérogénéité des communications faites et montrent
l'urgence pour l'historien d'étudier les fréquences dans leur variabilité ainsi que les structures
sémantiques.
La statistique lexicale dispose d'instrument pour étudier la variabilité des fréquences et d'abord la loi «
rang-fréquence » (ou loi de Zipf) généralisée par B. Mandelbrot et qui peut également être considérée
comme une loi de Pareto. Ceci veut dire que le système conceptuel est lui-même un objet fractal, ce qui
ne devrait pas manquer de réactiver l'intérêt pour ce type de recherches. Quant aux études sur la
variabilité des fréquences, elle manifestent qu'il n'y a pas adéquation avec un modèle
hypergéométrique et donc qu'il faut tenir compte de la longueur du texte et du système propre de
l'émetteur car parler est l'acte social par
excellence. Pour étudier les structures sémantiques, le passage par l'utilisation des réseaux
sémantiques semble indispensable et il reste à mettre au point les instruments informatiques qui,
permettant de faire varier les valeurs des indices retenus, feront mieux saisir les relations entre texte et
production de sens.
L'historien a tout intérêt à confronter l'étude des constantes chiffrées d'un texte à l'étude de ses
structures sémantiques : cette manière d'utiliser le texte, donnée fondamentale de l'historien, devrait lui
ouvrir des horizons nouveaux.
Abstract
Alain Guerreau. Why (and how) must historian count words ? The proceedings of the international
conference held in Nice in June 1985 on quantitative and computer methods for the study of texts
display a great diversity and reveal that the historian must study frequencies through their variability,
and through semantic structures. Lexical statistic make use of various instruments to study the
variability of frequencies : first the « rank-frequency » law (Zipf law), generalised by B. Mandelbrot and
which may be considered as a Pareto law. This means that the conceptual system is itself a fractal
object and this fact may reactivate this field of research. Studies on variability of frequencies show that
there is no adjstment to the hypergeometrical model and that text length and the speaker's
idiosyncrases are to be taken into account ; since speaking is the social act par excellence. For study
semantic structures, one must use semantic networks but some computers tools must be devised ;
making the variation of the values of coefficients possible, they will make the relationship between text
and production of meaning easier to understand.
It is most informative for the historian to confront the numerical constants of a text with its semancic
structures : this approach of the text ought to open new vistas to historical research.Histoire & Mesure, 1989, W-112, 81-105
OUTILS ET DÉMARCHES :
statistiques textuelles
Alain GUERREAU
POURQUOI (ET COMMENT) L'HISTORIEN
DOIT-IL COMPTER LES MOTS ?
d'opérations recherche manière statistique historiens. livrer La sur nécessité dont historique. Même linguistique les statistiques, cette résultats de la pratique minorité compter n'a de n'est généralement pourrait ces gui les guère mots n'ignore comptages contribuer évidente selon pas qu'une diverses à totalement aujourd'hui à des l'efficacité idée procédures, séries très l'existence aux globale méthodiques ténue yeux et de des se la
S'agissant en particulier des historiens français, cette situation a au
moins deux causes simples. La mieux perceptible est l'effroi de la plupart
de nos collègues devant le moindre chiffre (1). La seconde, bien moins
visible, est plus pernicieuse : c'est le peu d'attention accordé à l'examen
détaillé et littéral des textes, l'attitude préréflexive qui consiste à croire
gue la plupart des textes sont transparents (les seuls qui ne le sont pas
étant les textes dits « littéraires » qui, justement parce qu'ils sont
caractérisés, croit-on, par un « style », sont quasi-inutilisables par les
historiens). En France, la formation de ceux-ci ne comporte même pas
les notions les plus élémentaires de philologie et de linguistique, ce qui
est peut-être une des raisons majeures de la persistance opiniâtre, malgré
toutes les dénégations, d'une attitude fondamentalement « positiviste »,
c'est-à-dire de l'incapacité à raisonner à propos des relations entre
réalité, représentations et mots (2). Sur ces deux causes génériques, nous
n'avons guère de prise. Mais il existe encore, présentement, un tiers
aspect négatif : l'image effectivement trop floue des rapports, réels et
potentiels, entre l'histoire et la statistique linguistique. Cette situation
résulte sans doute d'abord du fait que celle-ci a été jusqu'ici pratiquée
pour l'essentiel par des «littéraires», et plus généralement par des
« spécialistes » des textes ; mais aussi de ce que cette pratique, relative-
81 & Mesure Histoire
ment récente, demeure très parcellisée et qu'il est malaisé de s'en faire
une idée d'ensemble, pour ne pas parler d'une vue cohérente - dont les
praticiens eux-mêmes ne paraissent guère se soucier. Nous saisirons
l'occasion d'une lecture des actes du colloque international organisé par
Etienne Brunet à Nice en juin 1985 (3) pour essayer à la fois de réfléchir
sur les liens fondamentaux entre les diverses démarches empiriques, ainsi
que sur les avantages qu'il y aurait à rendre ces liens beaucoup plus
explicites, et, dans un second temps, de suggérer quelques perspectives
de travail qui semblent devoir s'intégrer très directement à la recherche
historique (strictissimo sensu).
TEXTE TOUFFU, LECTURE INCOMMODE.
Les deux volumes (930 pages) des actes de ce colloque ne sont pas
présentés d'une manière qui en rende la lecture attrayante ni l'usage
commode. Le nombre de pages octroyé à chaque communication a été
drastiquement limité ; l'ordre alphabétique des auteurs aboutit à un
mélange exaspérant, et aucun index-matière ne permet de repérer les
développements constructifs (4). On ne peut pas ne pas succomber
rapidement à l'impression que le choix de l'ordinateur comme plus grand
commun dénominateur aboutit, comme d'habitude, à une triste cacophon
ie.
Pour y voir un peu plus clair, on devra d'abord faire abstraction de la
moitié environ des quatre-vingt-dix communications, c'est-à-dire de
toutes celles consacrées à de simples présentations de matériels, de
logiciels, de banques de données, à propos de quoi aucun exemple
pertinent au plan scientifique n'est présenté. Les questions pédagogiques,
de même que les considérations subjectives sur tel ou tel « style », n'ont
pas davantage de relations avec les problèmes qui nous occupent.
On peut, en première approche, ranger les quarante-cinq textes
restants en quatre groupes inégaux :
- des analyses orientées sur les calculs : 7 ;
- les problèmes de lemmatisation et d'analyse syntaxique : 12 ;
- des considérations sur les méthodes d'attribution des textes : 3 ;
- des recherches de sémantique : 15.
Cette phase préliminaire indispensable de tri et de regroupement
permet de percevoir enfin l'intérêt propre d'un tel colloque : offrir une
large gamme d'exemples des divers travaux entrepris dans une perspect
ive que l'on peut approximativement définir comme l'étude quantitative
des textes. Le nombre de pays représentés était considérable, ce qui
atteste d'emblée le degré déjà avancé de l'évolution de la discipline.
Mais si, comme on vient de l'indiquer, des regroupements paraissent

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents