Une utilisation de l ordinateur en histoire médiévale : Le traitement de textes - article ; n°4 ; vol.2, pg 132-147
17 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Une utilisation de l'ordinateur en histoire médiévale : Le traitement de textes - article ; n°4 ; vol.2, pg 132-147

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
17 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Médiévales - Année 1983 - Volume 2 - Numéro 4 - Pages 132-147
16 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Informations

Publié par
Publié le 01 janvier 1983
Nombre de lectures 19
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

Marie-Anne De Mercoyrol
Une utilisation de l'ordinateur en histoire médiévale : Le
traitement de textes
In: Médiévales, N°4, 1983. pp. 132-147.
Citer ce document / Cite this document :
De Mercoyrol Marie-Anne. Une utilisation de l'ordinateur en histoire médiévale : Le traitement de textes. In: Médiévales, N°4,
1983. pp. 132-147.
doi : 10.3406/medi.1983.928
http://www.persee.fr/web/revues/home/prescript/article/medi_0751-2708_1983_num_2_4_928Marie-Anne De MERCOYROL
UNE UTILISATION DE L'ORDINATEUR
EN HISTOIRE MEDIEVALE : LE TRAITEMENT DE TEXTES
Dans la même optique que Guy Jacquesson dans le n° 2 de cette revue (1),
j'aimerais piésenter aux lecteurs de MÉDIÉVALES une des possibilités de
l'utilisation de l'ordinateur par un historien ou un linguiste n'ayant que peu
de connaissances en informatique. Précisons tout de suite que ces méthodes
de traitement de texte ont fait leurs preuves depuis plusieurs années dans des
registres de textes aussi variés que les inventaires après décès, les chartes, les
cadastres, les généalogies et les divers genres littéraires. L'utilisation de ces
méthodes exige peu de connaissances en informatique, pour ma part j'ai suivi
un stage et un séminaire d'initiation.
Voyons donc quels sont les principes, les méthodes et les avantages du
traitement automatique des textes.
Les principes.
L'ordinateur a une capacité fantastique de classer les données qu'on lui
soumet. C'est cette capacité que nous utilisons quand nous lui demandons de
composer automatiquement des index à partir de textes selon des hiérarchies
que nous lui imposons :
— soit ordre alphabétique,
— soit ordre numérique,
— soit les deux composés.
1. Ordtnateun et manuscrits: proposition pour une généalogie des textes, paçc 1 22.
132 L'ordinateur peut également compter rapidement de grandes masses de don
nées, ainsi il peut calculer le nombre d'occurences des mots du texte et nous
donner des index de fréquence.
La souplesse du système tient au fait que Ton peut définir des critères de
classement des mots variables et complémentaires. Il est également possible
d'imposer à l'ordinateur des regroupements des listes de vocabulaire en établis
sant à l'intérieur du même texte des registres différents appelés « langue ».
Par exemple P. Guiraud étudiant le vocabulaire des tragédies de Racine (2)
distingue les discours de chaque personnage qui sont chacun une langue diffé
rente pour l'ordinateur. Cet artifice permet de comparer les index et les statis
tiques lexicales fournies pour chaque langue.
Voyons donc concrètement les méthodes à employer pour obtenir ce genre
de découpage et d Index.
Les méthodes.
Pour présenter les méthodes du traitement de texte, j'exposerai à la fois
la méthodologie et ma propre expérience. En effet, dans le cadre de ma thèse
de 3éme cycle, je travaille à l'édition d'un recueil d'exempla, La Scab Ceti, de
Jean Gobi. Ce type original de texte est composé selon un plan stéréotypé:
le canal d'information, la leçon théologique ou morale, le récit et éventuelle
ment une exégèse allégorique du récit (3).
Une fois le recueil transcrit j'ai dû choisir comme tout utilisateur un logiciel
ou programme qui paraisse répondre à mes exigences et à ma problématique.
A ce niveau il est important de se renseigner très précisément sur les contraintes
qu'impose un logiciel dans la saisie des données. J'ai choisi donc le logiciel
ALINE pour les listes générales de vocabulaire sans distinction de langue,
programme peu coûteux et assez simple d'utilisation, et le logiciel JEUDEMO
pour les index regroupés par langue; les deux logiciels fournissant aussi des
statistiques sur le nombre de mots et leur longueur moyenne (4).
Quand l'utilisateur a fait ainsi son choix il doit opérer la saisie des données.
A cette étape de son travail plusieurs possibilités s'ouvrent à lui:
2. P. GUIRAUD, Les caractères statistiques du vocabulaire, Essai de méthodologie,
Paris, 1954 ; et Statistique et analyse linguistique, Paris, PUF, 1966.
3. C. BRÉMOND, J. LE GOFF, J.-C. SCHMITT: L'Exemplum, Typologie des sources
du Moyen Age Occidental, Brepols, Belgique, 1982.
4. ALINE a été mis au point par J.P. Genet de l'Université de PARIS I. J'ai découvert
l'existence de JEUDEMO mis au point par l'Université de Montréal au séminaire de l'EHESS
animé par A. Zysberg et J.P. Coulier : Informatique et Histoire.
133 — soit « entrer » tout son texte dans l'ordinateur: technique du « full
text », que j'ai choisie en prévision de son édition.
- soit sélectionner les parties du texte qui l'intéressent ou les types de mots
qu'il veut retenir.
On a parfois intérêt à évacuer tous les mots-outils, par exemple dans le cas
des inventaires après décès (S).
Ensuite l'utilisateur peut décider de coder son texte.
Les codages possibles.
1 -Les systèmes de références à une édition, à une page, à un chapitre, à
une date... pour la Scala Cett j'ai retenu ici le numéro de la rubrique, le numéro
de Yexemplum et le numéro de la ligne.
2 - Un codage au fil du texte : la mention des diverses langues, la mention des
différentes catégories de mots que l'on veut distinguer par un indice numérique
ou un symbole quelconque qui permet d'obtenir un index pour chaque caté
gorie de mots.
Pour mon étude J'ai mis en valeur S langues:
= I le canal d'information
= L la leçon
= R le récit
= E l'exégèse allégorique
= P le provençal
Ensuite j'ai codé les mots selon des catégories grammaticales et sémantiques
(cf. photocopie du listing).
Une fois le texte codé il faut « l'entrer en machine », terme barbare qui
évoque seulement le fait de taper son texte sur un clavier relié à un terminal
d'ordinateur ou à un mini-ordinateur, ce dernier ayant une capacité de 3000
lignes maximum actuellement. Les ordinateurs sont équipés de logiciels comme
EDIT2 au centre de calcul de PARIS I ou WILBUR au CIRCE d'Orsay qui
facilitent les insertions dans le texte, les corrections et les changements rapides
de chaînes de caractères.
Ainsi je pourrai décoder rapidement une copie de mon texte codé pour
la préparer à l'édition.
S. J.-P. COULIER : « Problèmes de vocabulaire dans les inventaires après décès », dans
Le Médiéviste et l'Ordinateur, n° 6, Automne 1981.
134 \J p
Quand le texte est copié sur un disque ou une disquette il peut être traité
par un programme. Je vais donc présenter maintenant mon expérience personn
elle de traitement d'un texte, la préparation des données ayant déjà été
présentée, nous verrons ici les types de listings obtenus et les possibilités
d'exploitation qu'ils offrent.
Une expérience de traitement de texte : La Scala Cett.
Ce recueil du XlVème siècle est une compilation de quelques 1000 exempta
ventilés dans 125 rubriques alphabétiques de Abstinencia à Usura. La taille
même du corpus était une incitation à utiliser les services de l'ordinateur. Mon
but est de faire une édition du recueil accompagnée d'index précis. Au niveau
de l'édition l'avantage du fichier sur disque magnétique est qu'il peut être
complété à tout moment, par exemple ici par la liste des mots-clés dont la
définition est en cours d'élaboration (6).
Ma problématique s'articule sur une étude du fonctionnement du recueil
alphabétique, nouveauté de la fin du XlIIème siècle, du point de vue de sa
forme et de son contenu.
Les index donnés par rubrique me permettront de comparer le vocabulaire
de celles-ci et de tester par là même la solidité de la rubrique.
Les listings obtenus grâce à JEUDEMO sur un échantillon de 73 exempta
donnent une idée de la variété des listes qu'il est possible d'obtenir. (Cf. organi
gramme.)
A - La liste générale du vocabulaire me donnera :
1 - Les sources de Jean Gobi (codes 8 et 9)
2 - La projection géographique des récits (code 5)
3 - Les personnages historiques ou donnés comme tels (code 6)
4 - Les protagonistes des récits (code $)
5 -Les

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents