En Italie : linguistique et électronique - article ; n°1 ; vol.17, pg 19-32
15 pages
Français

En Italie : linguistique et électronique - article ; n°1 ; vol.17, pg 19-32

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
15 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Communication et langages - Année 1973 - Volume 17 - Numéro 1 - Pages 19-32
Depuis 1964, IBM-Italie a mis à la disposition des universités italiennes un ordinateur de type 7090 qui fut installé à Pise. Bien avant cette date, un groupe de chercheurs s'était en effet formé dans cette ville pour étudier les possibilités de la transcription électronique dans tous les domaines. Le Pr Antonio Zampolli, directeur de la Section de linguistique du C.N.U.C.E. (Centre national universitaire de calcul électronique) et coordonnateur des travaux linguistiques et littéraires des centres de recherche IBM en Italie, expose dans cette étude les immenses possibilités offertes par l'électronique en matière de linguistique, comme en d'autres domaines scientifiques et littéraires, et décrit l'éventail des travaux déjà réalisés.
14 pages

Informations

Publié par
Publié le 01 janvier 1973
Nombre de lectures 30
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

Antonio Zampolli
Janine Feller
En Italie : linguistique et électronique
In: Communication et langages. N°17, 1973. pp. 19-32.
Résumé
Depuis 1964, IBM-Italie a mis à la disposition des universités italiennes un ordinateur de type 7090 qui fut installé à Pise. Bien
avant cette date, un groupe de chercheurs s'était en effet formé dans cette ville pour étudier les possibilités de la transcription
électronique dans tous les domaines. Le Pr Antonio Zampolli, directeur de la Section de linguistique du C.N.U.C.E. (Centre
national universitaire de calcul électronique) et coordonnateur des travaux linguistiques et littéraires des centres de recherche
IBM en Italie, expose dans cette étude les immenses possibilités offertes par l'électronique en matière de linguistique, comme en
d'autres domaines scientifiques et littéraires, et décrit l'éventail des travaux déjà réalisés.
Citer ce document / Cite this document :
Zampolli Antonio, Feller Janine. En Italie : linguistique et électronique. In: Communication et langages. N°17, 1973. pp. 19-32.
doi : 10.3406/colan.1973.3980
http://www.persee.fr/web/revues/home/prescript/article/colan_0336-1500_1973_num_17_1_3980EN ITALIE:
LINGUISTIQUE ET
ELECTRONIQUE traduction par Antonio Janine Zampolli Feller
coordonnateur Depuis un du étudier scientifiques un domaines. par IBM ordinateur groupe l'électronique C.N.U.C.E. en 1964, les Italie, Le de possibilités et IBM-Italie Pr de des expose (Centre littéraires, chercheurs Antonio type en travaux matière dans 7090 a national de Zampolli, mis linguistiques et s'était cette qui la de décrit à fut transcription linguistique, la universitaire étude directeur en installé l'éventail disposition et effet les littéraires à immenses de formé comme des électronique Pise. de des la travaux des calcul Section Bien dans universités en centres possibilités d'autres avant déjà cette électronique) dans de de réalisés linguistique cette ville recherche italiennes domaines tous offertes date, pour l. les et
L'histoire de la statistique linguistique est bien plus ancienne
que celle des ordinateurs électroniques. Dans l'antiquité, les
grammairiens d'Alexandrie relevaient déjà les hapax, c'est-à-
dire les formes n'apparaissant qu'une fois dans le cours d'une
uvre. Au Moyen Age, il y eut un courant d'érudition qui lança
les concordances de la Bible, répertoire de tous les mots des
textes bibliques et de tous leurs emplois dans leur contexte.
C'étaient alors des groupes de moines qui étaient chargés #de
faire ce que font aujourd'hui les ordinateurs du C.N.U.C.E. *de
Pise. On a souvent répété (mais c'est probablement une info
rmation apocryphe) que le cardinal Hugues de Saint-Cher (mort
en 1263) n'employa pas moins de cinq cents moines pour la
compilation de la première authentique concordance de la
Bible. Aux XVIe et XVIIe siècles, les index de certaines édi
tions latines auraient donné satisfaction à nos statisticiens
les plus exigeants.
La méthode de dépouillement manuel d'un texte consiste à en
transcrire les mots un à un sur une fiche, avec leur proche
contexte, c'est-à-dire la phrase à laquelle ils appartiennent. On
dispose ensuite les fiches par ordre alphabétique. Il est clair
1. Depuis décembre 1970, date du renouvellement des accords entre IBM-Italie et l'université de
Pise, on a rajouté au système 7090 un nouvel ordinateur beaucoup plus puissant, le système 360
IBM, modèle 67. Ce permet l'exécution presque simultanée de travaux demandés par des
usagers différents, ainsi que le calcul de données à distance. Les chercheurs géographiquement
éloignés de Pise peuvent donc utiliser l'ordinateur comme s'ils avaient un puissant centre de calcul
à leur disposition. En Italie : linguistique et électronique
que si, pour chaque mot, on retranscrit une phrase d'une
moyenne de dix mots, cela revient à retranscrire au total dix fois
la valeur du texte.
Lorsque l'on sut, en 1951, qu'il était possible d'utiliser des
installations mécanographiques pour l'index de la Somme
théologique de saint Thomas d'Aquin, on se trouva devant une
situation entièrement nouvelle en matière de lexicographie.
L'aide que le linguiste peut recevoir du calculateur électronique
pour compiler à une vitesse extrême un très grand nombre de
données tient à la nature même du langage tel que le conçoivent
les théories actuelles de linguistique générale.
Pour étudier une langue, il est donc nécessaire de partir de
l'analyse des « textes », c'est-à-dire des différents ensembles
utilisés par les individus dans leurs communications. C'est en
tronçonnant ces textes et en les comparant que l'on peut retrou
ver les composantes fondamentales du message communiqué,
les « signes linguistiques ». Une étude comparative peut ainsi
démontrer, d'une part, ce qui, dans le message, relève dire
ctement des possibilités d'un système employé comme simple
moyen de communication et, d'autre part, ce qui appartient à
une mise en uvre particulière, individuelle, devenue l'expres
sion d'un style et, dans certains cas, de la poésie.
A QUOI SERT L'ORDINATEUR POUR UN LINGUISTE ?
La meilleure réponse, ce sont sans doute les exemples d'appli
cations concrètes qui peuvent la donner. On peut choisir parmi
les nombreux travaux que les instituts spécialisés, ayant leur
siège dans différentes villes d'Italie et d'Europe, poursuivent
en collaboration avec la Section de linguistique du Centre natio
nal universitaire de calcul électronique de Pise.
Les ordinateurs employés sont du système 360 IBM, modèle 67,
IBM 7090 et IBM 1401, dotés de dispositifs particuliers pour
pouvoir imprimer toute la riche gamme d'alphabets et de carac
tères nécessaires à l'élaboration de textes littéraires. Toutes
n. ou presque toutes les recherches italiennes de linguistique ont
^- lieu au Centre de Pise. Cela constitue un avantage sensible,
o> qui assure l'uniformité des critères et des méthodes d'élabora-
|> tion des textes enregistrés : ils représentent plus de 50 mil-
¦2 lions de mots dans plus de 20 langues. Car, si les textes sont
« élaborés avec les mêmes critères, il est alors possible de
§ constituer une grande bibliothèque électronique où le chercheur
*= peut immédiatement repérer non seulement les données rela-
| tives à l'uvre auquelle lui-même se consacre, mais aussi aux
| auteurs de la même* école ou de la même époque, ou du même
O So genre littéraire, déjà présents dans la bibliothèque. Informatique 21
ETABLIR LA LISTE DE CONCORDANCE
ET LA FICHE DE CONTEXTE
La première phase de l'élaboration confiée à l'ordinateur, indé
pendante de la nature des textes analysés et du but de la
recherche, consiste dans l'analyse du lexique, jusqu'au rassem
blement des fréquences, des concordances et des diverses
sortes d'index sous lesquels sont catalogués les mots soumis à
l'investigation. Définissons quelques termes simples à propos
de ce tercet de Dante :
« Par moi, l'on va dans la cité de souffrance,
» Par va à l'éternelle douleur,
» moi, l'on va parmi la race des perdus. »
II y a 24 mots (en italien), 8 pour chaque vers, mais cer
tains d'entre eux sont semblables. Si nous ne tenons pas compte
des répétitions, nous trouvons que les formes2 ou les mots
différents du tercet sont en tout 14 (par, moi, I', on, va, dans,
la, cité, souffrance, éternelle, douleur, parmi, race, perdus). Le
nombre des répétitions de chaque mot s'appelle fréquence
absolue de la forme du texte. Si nous voulons maintenant cher
cher les formes dans n'importe quel dictionnaire, nous ne
chercherons pas, par exemple, « va », mais « aller » ; ne
trouverons pas « perdus », mais seulement « perdre » ou
« perdu ». Appelons « lemmes » les formes de base : « aller »,
« perdre », c'est-à-dire en général les mots titres que nous trou
verons normalement consignés dans le dictionnaire. Les formes
et les lemmes d'un texte peuvent être disposés selon divers
critères : par ordre alphabétique ou par ordre de fréquence
(du plus fréquent au moins fréquent) ;

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents