Terminologie, ingénierie linguistique et gestion de l information - article ; n°157 ; vol.39, pg 25-35
12 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Terminologie, ingénierie linguistique et gestion de l'information - article ; n°157 ; vol.39, pg 25-35

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
12 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Langages - Année 2005 - Volume 39 - Numéro 157 - Pages 25-35
Stéphane Chaudiron : Terminologie, ingénierie linguistique et gestion de l'information.
Terminology science is part of the broader field of language processing. Terminology is involved in several key domains of the new industries issued from researches on data processing applied to languages. Knowledge engineering, data mining, search engines are in some aspects dependant on terminology science.
11 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Informations

Publié par
Publié le 01 janvier 2005
Nombre de lectures 87
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

M. Stéphane Chaudiron
Terminologie, ingénierie linguistique et gestion de l'information
In: Langages, 39e année, n°157, 2005. pp. 25-35.
Abstract
Stéphane Chaudiron : Terminologie, ingénierie linguistique et gestion de l'information.
Terminology science is part of the broader field of language processing. Terminology is involved in several key domains of the
new industries issued from researches on data processing applied to languages. Knowledge engineering, data mining, search
engines are in some aspects dependant on terminology science.
Citer ce document / Cite this document :
Chaudiron Stéphane. Terminologie, ingénierie linguistique et gestion de l'information. In: Langages, 39e année, n°157, 2005.
pp. 25-35.
doi : 10.3406/lgge.2005.972
http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_2005_num_39_157_972Stéphane Chaudiron
Université de Paris X
Terminologie, ingénierie linguistique
et gestion de l'information
1. INTRODUCTION
Face au défi de la sur-information auquel les usagers des réseaux électroniques
sont confrontés, l'information est d'abord un processus d'élimination de l'informat
ion. Internet est devenu le lieu emblématique de ce désordre informationnel. La
croissance de la quantité d'information dans les multiples sphères d'Internet
engendre un sentiment d'incertitude de l'observateur. Son hétérogénéité contribue à
renforcer ce sentiment, qui est devenu l'état cognitif « normal » de tout usager
d'Internet qui craint de « passer à côté » de l'information stratégique. Cette hétérogén
éité s'observe à plusieurs niveaux : pertinence et fiabilité incertaine, multiplicité des
formats d'enregistrements, données de plus en plus multilingues.
Dans ce contexte, quel peut être le rôle de la terminologie et de l'ingénierie
linguistique ?
La question du traitement automatique de l'information textuelle sur Internet est
une clé. L'extension des réseaux induit un bouleversement des besoins
informationnels, qui se caractérise par une nécessité accrue d'identifier et de traiter
l'information en (presque) temps réel, de détecter les indices d'une modification de
l'environnement, de filtrer l'information la plus adaptée au contexte d'usage, de
naviguer facilement dans des volumes de données toujours plus imposants. Dans
ces processus, la capacité des outils logiciels à analyser le contenu informationnel et à
traiter l'hétérogénéité linguistique est essentielle. En effet, le traitement de l'informa
tion par des méthodes automatisées n'est possible que si elle est codée, classée et
balisée de manière adéquate.
C'est ici qu'intervient le rôle central de la terminologie, entendue comme
pratique visant à constituer des ensembles structurés de termes, dans un univers où
l'information est de moins en moins structurée. Dans cet univers informationnel
mouvant, la terminologie occupe une double fonction : elle permet d'une part de
borner des domaines de connaissance, facilitant ainsi une appropriation par les
usagers des techniques de gestion de connaissance, et d'autre part d'améliorer la
performance des logiciels de traitement automatique de l'information.
Langages 157 25 terminologie : nature et enjeux La
Dans cet article, nous nous attacherons à expliciter ce double rôle, central, de la
terminologie dans les outils de traitement linguistique de l'information en présentant
plusieurs exemples. Il ne s'agit pas de dresser un panorama exhaustif de toutes les
applications mais de préciser, à travers quelques exemples significatifs, l'apport de la
terminologie au traitement informatique des langues.
2. LE CYCLE DU TRAITEMENT INFORMATIONNEL
II est donc possible de considérer la terminologie sous deux approches complé
mentaires : une première approche qualifiée de vue informationnelle qui considère les
terminologies comme la ressource essentielle de la gestion de l'information et une
seconde approche qualifiée de vue logicielle dans laquelle la terminologie est consi
dérée comme une ressource linguistique nécessaire au bon fonctionnement des logi
ciels d'ingénierie linguistique.
À partir des différents univers informationnels, notamment la mémoire et le patr
imoine immatériel des entreprises, les nombreux corpus textuels produits dans les
organismes scientifiques, techniques, réglementaires, etc., des terminologies spéciali
sées sont produites qui alimentent en ressources linguistiques (dictionnaires,
thésaurus, réseaux sémantiques. . .) les outils de traitement linguistique en leur permett
ant de fonctionner. Ceux-ci permettent à leur tour de traiter les corpus relevant des
différents univers informationnels. La figure 1 représente ce fonctionnement cyclique.
Outils d'ingénierie
linguistique
Figure 1 : Le cycle du traitement informationnel
En tant que corpus délimitant des univers informationnels, les terminologies sont
des outils de description de champs de connaissance au même titre que les nomenc
latures, les thésaurus ou les ontologies. À ce titre, elles interviennent dans différents
processus de gestion de l'information comme le Knowledge Management, la veille str
atégique, l'intelligence économique, la valorisation de la mémoire d'entreprise ou la
gestion du patrimoine informationnel de l'entreprise.
La figure 1 visualise le double rapport qu'entretient la terminologie avec l'ingé
nierie linguistique. Dans de nombreuses applications (la traduction, l'analyse de
contenu, le résumé, la recherche et le filtrage d'informations notamment), la terminol
ogie est utilisée comme une ressource linguistique nécessaire au fonctionnement des
applications de traitement automatique des langues (TAL). Dans d'autres applicat
ions, les terminologies sont à l'inverse des résultats produits par les outils d'ingénierie
linguistique et, plus largement, des applications de traitement informatique des
26 ingénierie linguistique et gestion de l'information Terminologie,
langues. Dans ce cas, elles sont construites à partir de grands volumes de données
textuelles afin de produire des listes de termes qui permettront ensuite d'élaborer des
dictionnaires, des terminologies, des thésaurus. . .
3. LA TRADUCTION AUTOMATIQUE OU ASSISTÉE PAR ORDINATEUR
La place de la terminologie dans les systèmes de traduction est centrale. En effet,
l'utilisation de dictionnaires, glossaires et terminologies spécialisées pour aider le
traducteur dans sa tâche lui permet non seulement d'améliorer sa productivité mais
également de contrôler la qualité de la traduction, principalement dans les domaines
de haute technicité. C'est donc tout naturellement que les premières terminologies
informatisées sont apparues sous forme de banques de données, d'abord accessibles
en ligne puis disponibles sur cédéroms avant d'être des éléments constitutifs
majeurs des logiciels de traduction.
3.1. La traduction automatique
Les logiciels de traduction automatisent l'intégralité du processus de
traduction de telle sorte qu'aucune intervention humaine n'est requise. Le logiciel agit
comme une « boîte noire » dans laquelle le texte source est entré et de laquelle sort le
texte cible. L'automatisation complète du processus permet de gagner incontestable
ment en rapidité par rapport à la traduction humaine, et permet également d'écono
miser les coûts de traduction. Néanmoins, ce gain économique s'effectue au détriment,
pour le moment encore, de la qualité de traduction. La traduction est en effet un
processus cognitif extrêmement complexe au cours duquel les différents niveaux
linguistiques interviennent (morphologie, syntaxe, sémantique et même pragmatique
pour identifier et tenter de résoudre les ambiguïtés liées au contexte de renonciation).
L'accroissement des ressources terminologiques, en particulier dans les domaines de
spécialité, est une des pistes permettant d'améliorer la qualité des traductions. On peut
constater à cet égard que la plupart des logiciels du commerce permettent précisément
à l'utilisateur d'intégrer son propre vocabulaire. Mais si des efforts de description
terminologique sont encore certainement à consentir, d'autres problèmes peuvent être
signalés, comme le manque de robustesse de l'analyse liée notamment à la difficile

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents