L'application du traitement automatique de la langue écrite à la recherche d'information et à la communication homme-machine bute sur deux problèmes complexes : comment atteindre automatiquement le sens d'un texte pour représenter les connaissances qu'il véhicule et effectuer des raisonnements sur ces connaissances ? Comment raisonner à partir du texte lui-même et non sur la base de savoirs, posés a priori, et auxquels réfère ce texte ? Cet ouvrage tente de répondre à ces questions en apportant des solutions aussi indépendantes que possible des domaines référentiels couverts par les textes analysés (dialogues, documents techniques, etc.). À partir de la définition et du traitement sémantique d'énoncés élémentaires, il généralise des modèles de sémantique et de pragmatique linguistique et montre comment représenter les connaissances dans une base unique. Travail interdisciplinaire fondé sur la linguistique, les disciplines formalisantes et l'informatique, cet ouvrage aborde ces domaines scientifiques d'une façon à la fois généraliste et utilitaire. Il définit une méthodologie et des modèles, en montre le fonctionnement et les illustre par des exemples clairs. Introduction. Le couple sémantique-pragmatique. Les objets-de-discours. Représentation des connaissances pour une mémoire discursive. Les objets-de-discours individuels. Les énoncés élémentaires. Élaboration d'un modèle de sémantique en TAL. Détermination, type de procès et énonciation. Syntaxe et sémantique. Structure des énoncés élémentaires. Calcul des énoncés élémentaires. La représentation et la gestion des connaissances. Langage de la mémoire discursive : I - Le langage.Le système de la mémoire discursive : II - Raisonnements et fonctionnement. Éléments pour un système d'analyse automatique de la langue. Index/Bibliographie.
Informations légales : prix de location à la page 0,0502€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.
Extrait
Visée
Introduction
Ce livre est centré sur deux problèmes imbriqués : 1) comment atteindre automatiquement le sens dun texte pour représenter les connaissances quil véhicule et effectuer des inférences à partir de ces connaissances ; 2) comment résoudre ce problème à partir du texte lui-même et non sur la base de savoirs liés à ce texte et posésa prioridans une représentation des connaissances guidant le traitement linguistique.
Point de vue
Pour lobservateur naïf, analyser un texte cest le « comprendre », donc atteindre le « sens », donc dégager « de quoi ça cause ». Ce point de vue honorable nest plus défendable dans une analyse automatique de textes. Dabord parce que lon connaît pas totalement les mécanismes de compréhension mis en uvre par un humain ; ceci est conÞrmé par léchec de la plupart des tentatives qui ont voulu calquer lanalyse automatique sur une supposée connaissance de ces mécanismes.
En fait, le recours à un ordinateur suppose le passage à une analyse formelle, ana-lyse sans doute fort éloignée des processus activés par un humain dans sa tâche de compréhension de texte. Ce fonctionnement formel oblige à repenser le point de vue et, donc, à élaborer des procédures algorithmiques ou heuristiques pouvant être calcu-lées par un système informatique.
Le travail ici présenté adopte, dans ce cadre, un point de vue particulier : il pose lancrage linguistique de ces procédures, en les mettant au centre des analyses. Il tente donc dapporter des solutions les plus indépendantes possible du domaine référentiel
18
Intelligence
linguistique
couvert par les « discours » analysés (textes, dialogues. . . produits dans des conditions homogènes). En ce sens, il va à contre-courant de la méthodologie dominante, laquelle est fondée sur une connaissance poséea priorides concepts de ce domaine. Nous nous attachons donc à remettre au centre du débat la matérialité de la langue et son analyse.
Contenu
Il sagit dun travail de traitement automatique des langues recherche en Sciences du langage. Certes, la linguistique y joue en tant que réserve de savoirs plus que de lieu de recherche.
(TAL) et non dune un rôle central,mais
Compte tenu de sa contrainte dautomatisation, cest un travail pluridisciplinaire fondé sur la linguistique, bien sûr, mais aussi les disciplines formalisantes et linforma-tique. Le problème est avant tout délaborer des procédures cohérentes en sappuyant sur les acquis de ces trois domaines scientiÞques, beaucoup plus que de faire avancer chaque discipline prise isolément. Ceci amène à un double abord de ces trois domaines scientiÞques, à la fois généraliste et utilitaire. Ceci passe par unÞltre critique et une adaptation des méthodes dont on sinspire, notamment linguistiques.
EnÞn, un système de TAL ne pouvant être envisagé en dehors dapplications spéci-Þques, nous avons orienté le travail dans une double perspective : la recherche dinfor-mation et la communication homme-machine. Ces applications ont été, et restent, la motivation du développement du système, sans en être le centre, puisque nous visons des procédures générales danalyse.
Organisation
Les deux parties portées par le titre - sémantique et pragmatique - ne sont pas ex-posées de façon linéaire : pour poser le problème de manière précise, nous donnons dabord une partie de la pragmatique, celle qui concerne les « objets-de-discours ». Vient ensuite lintroduction des « énoncés élémentaires » et leur traitement séman-tique. On peut alors généraliser le modèle pragmatique à ces énoncés et montrer com-ment on peut représenter les connaissances à la fois objectales et prédicatives dans une base unique, appelée « mémoire discursive ».
Ce long exposé mêle des considérations méthodologiques (chapitres 1, 2, 4), des exposés de modèles (chapitres 3, 5, 6, 7, 9) et des développements sur le fonctionne-ment des modèles (chapitres 8 et 10). Comme les modèles visés ne sont pas sufÞsam-ment achevés pour que lensemble puisse être automatisé, nous illustrons les passages essentiels en développant des exemples (chapitres 3 et 8).