//img.uscri.be/pth/1e065cd26c5ad0a4b08b974ec7d3076febdd7efe
Cette publication ne fait pas partie de la bibliothèque YouScribe
Elle est disponible uniquement à l'achat (la librairie de YouScribe)
Achetez pour : 19,50 € Lire un extrait

Lecture en ligne (cet ouvrage ne se télécharge pas)

Machine, Langage et Dialogue

De
352 pages
Le but de cet ouvrage est de faire le point sur la communication homme-machine, en se plaçant dans le champ pluridisciplinaire des sciences cognitives, et en insistant plus particulièrement sur les rôles respectifs de l'informatique et de la psychologie cognitive. Les problèmes de fond posés par l'utilisation de la langue par un humain qui communique avec une machine sont mis en lumière, et les auteurs ont donné une nette priorité aux aspects de communication par rapport aux approches théoriques de la linguistique.
Voir plus Voir moins

I

MACHINE, LANGAGE ET DIALOGUE

Collection Figures de l'Interaction dirigée par Alain Trognon et Michel Musial
Laboratoire de Psychologie de l'Interaction Université Nancy II

Les ouvrages publiés ressortent principalement du champ des interactions langagières et des actions de communication. La perspective est pluridisciplinaire mais l'approche est résolument micro-sociale. De plus en plus de travaux qui concernent à la fois les interactions et la cognition fleurissent dans le paysage scientifique et répondent au moins partiellement à la demande sociale qui aspire à une meilleure compréhension de phénomènes aussi complexes et divers que l'apprentissage dans et par le groupe en pédagogie, ou bien encore les processus de coordination de l'action en psychologie du travail et en psychologie sociale. En plus d'enrichir les connaissances relatives à l'interaction comme domaine empirique, la collecton proposera des instruments de travail novateurs et critiques à destination des experts d'un maximum de domaines d'application correspondants. C'est en faisant interagir les disciplines, leurs concepts et leurs méthodes, que l'on veut réinterroger les comportements aux confins du paradigme de l'interaction. Un dialogue fructueux naîtra de la confrontation de la psychologie et ses sous disciplines avec l'intelligence artificielle, la philosophie, la linguistique, la logique et la neurobiologie.

@ L'Harmattan, 1997 ISBN: 2-7384-5910-2

Gérard Sabah, Jean Vivier, Anne Vilnat, Jean-Marie Pierrel, Laurent Romary, Anne Nicolle

MACHINE, LANGAGE

ET DIALOGUE

L'Harmattan
5-7, rue de l'École Polytechnique 75005 Paris - FRANCE

L 'Harmattan Inc. 55. rue Saint-Jacques Montréal (Qc) - CANADA H2Y lK9

L'ordre des auteurs correspond

à l'ordre des chapitres qui suivent. . .

1. Introduction

Le présent ouvrage a pour objet de situer la communication homme-machine dans le champ pluridisciplinaire des sciences cognitives. Depuis le rebattu « test de Turing» les capacités dialogiques sont placées au cœur de l'intelligence et les travaux d'intelligence artificielle se sont obstinés, depuis les débuts de l'informatique, à simuler cette capacité langagière et à doter les machines d'interfaces pouvant «parler» et nous « comprendre ». Espoirs, échecs, nouveaux départs, etc. ont parsemé ce chemin difficile. Pourquoi donc aujourd'hui faire le point et expliciter les perspectives qui nous semblent possibles dans ce domaine, et plus particulièrement sur le dialogue homme-machine qui situe le langage dans des situations concrètes de communication? C'est qu'outre l'évolution naturelle des modèles et des techniques, il nous semble que la situation comporte des caractéristiques originales et prometteuses non encore rencontrées auparavant. En effet, au delà du rapprochement des positions des diverses disciplines qui s'intéressent au langage, leur degré de maturité, comme le contexte actuel, permettent d'en apprécier les validités respectives et de concevoir de véritables collaborations utiles et productives. Nous souhaitons donc ici rendre compte de telles confrontations et souligner leur potentiel pour l'avenir.

1.1 Le traitement automatique des langues
Le traitement automatique des langues est traditionnellement considéré comme une partie de l'intelligence artificielle, ce qui explique qu'on y retrouve principalement des

Machine, langage et dialogue

préoccupations d'infonnaticiens. Il est souvent divisé en trois sous-domaines que Gazdar (1993) dénomme: . théorie de la linguistique infonnatique, . linguistique infonnatique appliquée, . psycholinguistique infonnatique. Le premier est le point central qui étudie les fonnalismes de représentation et les mises en œuvre infonnatiques les plus efficaces des processus de traitement. Ces études sont généralement réalisées de façon assez abstraite, sans engagement par ailleurs à produire des artefacts utiles, et sans relation particulière avec les études portant sur l'esprit humain. Produire des résultats utiles ou comprendre «comment I'homme comprend» sont respectivement du ressort de la linguistique infonnatique appliquée et de la psycholinguistique infonnatique, les deux autres sous-domaines mentionnés cidessus. Bien que l'on trouve dans l'ensemble de ces recherches une prédominance significative du souci infonnatique, des psycholinguistes ont pensé, ces dernières années, que les simulations sur ordinateurs (les outils et les modélisations infonnatiques) sont aussi des moyens efficaces d'éclaircir la façon dont l'esprit humain traite le langage.

1.2 Pragmatique et dialogue homme-machine
Plusieurs distinctions vont nous pennettre de mieux situer notre objet. De façon surprenante, on trouve assez peu de recouvrements entre le traitement automatique de la langue écrite et le traitement automatique de la parole, tant au niveau des personnels qu'à celui des thèmes, des conférences et des revues concernées. Le second étudie les aspects spécifiques posés par le traitement de la parole, tandis que le premier - au moins en principe, et dépassant quelque peu son intituléétudie les problèmes fondamentaux communs aux fonnes écrites et orales du langage. Parmi ceux-ci, et malgré le fait qu'en pratique la morpho-syntaxe et la sémantique ont été

8

Introduction

largement privilégiées, les questions de pragmatique 1 nous
semblent essentielles. Souvent mal perçues, parce que difficiles à formaliser et considérées comme intervenant en fin de traitement après l'analyse syntaxico-sémantique, elles nous semblent au contraire devoir tenir un rôle primordial et diriger l'ensemble des traitements: c'est par leurs effets sur le monde que nous acquérons les mots, les structures syntaxiques et que nous leur donnons du sens; c'est en vue d'atteindre tel ou tel but que nous les produisons. Pour cette raison, le dialogue, qui ne peut traiter du langage qu'en situation, pose ces problèmes avec acuité; et le dialogue homme-machine, qui demande que rien ne reste implicite dans les modèles qu'il utilise, est bien entendu le lieu privilégié de l'étude de ces phénomènes. Ainsi, ce caractère premier de la pragmatique justifie la nécessité d'articuler le dialogue avec une théorie de l'action, mais ce n'est pas suffisant: il faut également prendre en considération une théorie de la référence. Par là même, dialogue, action et référence sont les trois éléments essentiels de nos contributions au présent livre. Une autre distinction souvent effective porte sur la compréhension opposée à la génération. Même si des applications importantes comme la traduction automatique (l'ancêtre du domaine) ou le résumé automatique impliquent que les deux aspects soient considérés, ils sont trop souvent séparés et utilisent des méthodes différentes. Là encore le dialogue homme-machine est un domaine fondamentalement intéressant par le pont qu'il oblige à faire entre compréhension et génération, par l'intermédiaire d'un même niveau de représentation profonde. Le but de ce livre étant de faire le point sur le dialogue homme-machine, en insistant sur les aspects interdisciplinaires, et plus particulièrement sur le rôle de la psychologie cognitive, nous avons choisi d'aborder les problèmes de fond posés par l'utilisation de la langue par un humain et une machine qui communiquent, plutôt qu'une présentation de divers systèmes destinés à illustrer le savoir-faire actuel. Nous avons donné une nette priorité aux aspects de communication par rapport aux 9

Machine, langage et dialogue

approches théoriques de la linguistique. Par là même, nous poserons probablement plus de questions que nous ne proposerons de réponses, mais nous espérons ainsi indiquer les directions essentielles pour les recherches à venir de ce domaine. Malgré la grande mode du multimodal et l'importance avérée des gestes dans le dialogue naturel, nous avons décidé de rester centrés sur la langue et le dialogue. L'usage quotidien du téléphone montre d'ailleurs que la communication strictement langagière se rencontre effectivement et ne constitue pas une simpliplifaction abusive; par ailleurs, les diverses allusions au traitement du geste coverbal que nous rencontrerons au fil de ce livre seront toujours analysées à la lumière du fonctionnement linguistique. S'il est clair que de nombreux problèmes d'analyse simultanée de divers systèmes de signes sont nécessaires pour une communication hommemachine efficace et générale, elles resteront en dehors du champ du présent ouvrage.

1.3 Historique
Les aspects essentiels des méthodes d'intelligence artificielle concernant le dialogue homme-machine ont été présentés dans plusieurs livres antérieurs réalisés par certains des présents auteurs. Rappelons en particulier l'ouvrage de Jean-Marie Pierrel « dialogue oral homme-machine» (Pierrel 1987), précisant les connaissances linguistiques, les stratégies et les architectures de systèmes permettant d'articuler l'ensemble des niveaux de traitement, de la reconnaissance de la parole à la gestion de l'ensemble du dialogue. Gérard Sabah dans «l'intelligence artificielle et le langage », présente diverses théories de pragmatique-linguistique pertinentes pour les traitements automatiques (Sabah 1988, ch 10), ainsi que divers systèmes de dialogue homme-machine (Sabah 1989). Ces points sont également synthétisés dans « Langage humain et machine» (Carré, et al. 1991) avec quelques illustrations 10

Introduction

issues des systèmes du CRIN (Centre de Recherche en Informatique de Nancy) et du LIMSI (Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur) . Ces ouvrages recouvrent les principaux problèmes abordés dans le domaine et concernent principalement deux aspects: les aspects linguistico-informatiques et les caractéristiques purement informatiques. Parmi les premiers on distingue plus particulièrement: . l'ambiguïté (l'éternel problème du traitement automatique des langues; mais il conviendra d'en souligner ici la relativité, en particulier dans le cas du dialogue: la langue est plus spécifiquement considérée dans son usage, même si bien souvent ce qui concerne l'intention communicative n'est pas vraiment considérée dans les travaux courants) . l'analyse et la syntaxe (après la période du «tout sémantique» des années soixante-dix, les grammaires informatiques se sont révélées nécessaires, avec l'avènement des grammaires d'unification, et les réflexions théoriques à propos du déterminisme) . les traitements morphologiques et les outils lexicaux (en particulier le développement de gros lexiques permettant de couvrir des domaines larges est devenu un des secteurs les plus soutenus par les industries de la langue et les projets européens) . l'utilisation de techniques statistiques (développées pour la reconnaissances de la parole, ces méthodes ne cherchent pas à reconnaître directement les mots prononcés, mais utilisent des connaissances statistiques sur les occurrences de couples de phonèmes (bigrammes) ou même d'ensemble d'éléments plus nombreux (multigrammes) et relèvent de la théorie des processus de Markov. Après apprentissage sur de très vastes corpus, des méthodes analogues sont maintenant employées également au niveau de la grammaire: on ne cherche alors plus à mettre en évidence les règles de la grammaire sous-jacente, mais à évaluer, sur la base de critères statistiques, la validité de telle ou telle séquence de mots).

11

Machine, langage et dialogue

D'un autre côté, les caractéristiques souhaitées des programmes produits concernent: 8la déclarativité (avérée pour le lexique et la grammaire, cette caractéristique, consistant à donner des connaissances en les dissociant de la façon de les utiliser, s'étend à la sémantique; constituer une sémantique déclarative pour les grammaires est proche dans l'esprit d'une sémantique formelle pour la logique, ce qui est devenu un domaine important de l'intelligence artificielle) 8 la portabilité et la réutilisabilité (après avoir développé des systèmes «jouets» illustratifs mais limités, on a créé des systèmes efficaces et utiles dans des domaines plus vastes, systèmes utilisés effectivement, mais confinés à ces domaines. On s'intéresse maintenant à la conception globale de systèmes dont les données soient facilement adaptabl~s à des domaines distincts de celui de leur application initiale, et la programmation par objets constitue un atout important de ce type d'approche. Cet aspect est bien entendu lié à la déc1arativité et à la mise à jour de modèles génériques) 8 la robustesse (légèrement passé de mode, mais toujours d'actualité, ce point est crucial pour le dialogue, où les interventions de l'interlocuteur de la machine peuvent ne respecter ni le lexique, ni la grammaire, ni même les connaissances sur le domaine. Il convient alors de disposer de procédures de rattrapage permettant un comportement « intelligent» dans de telles situations, ainsi que le développement de capacités d'apprentissage et d'adaptation au langage de l'interlocuteur).

1.4 Des applications, et après?
La mise en place d'interfaces homme-machine conviviales est devenue une des tâches essentielles de l'informatique et de l'intelligence artificielle. Nombre d'applications informatiques interactives concernant des tâches cognitives complexes apparaissent; le~ systèmes informatiques ne sont plus

12

Introduction

aujourd'hui limités à l'exécution de tâches ponctuelles, en réponse à des commandes humaines. Leur autonomie et leurs capacités d'initiative les rendent maintenant capables d'assister l'usager dans des activités de raisonnement variées et complexes, en le guidant et en lui fournissant les connaissances qui lui font défaut, en prenant en charge la résolution de sousproblèmes précis ou enfin en lui proposant des outils utilisables dans le cadre de ses propres stratégies cognitives. Toutefois, si l'on réfléchit aux applications effectives des travaux de traitement automatique des langues, on peut souligner, avec Gazdar (1993) que le plus difficile en ce domaine est: « de trouver des applications à la fois réalisables et utiles! ». Comme il le remarque, il ne suffit pas de faire deux listes et d'en prendre l'intersection: on ne peut pratiquement pas savoir avant de l'avoir réalisée si une application fondée sur l'utilisation d'une langue naturelle est faisable ou non; de même, on ne peut savoir avant de l'avoir commercialisé quel produit issu des industries de la langue sera réellement utile. On a cependant des informations assez solides en ce qui concerne les interfaces en langue naturelle. Les caractéristiques qu'on peut imaginer pour les produits des années à venir dans le court terme sont en gros les suivantes: des produits hautement modulaires, fondés sur une grammaire d'unification, utilisant un langage intermédiaire de représentation fondé sur (ou équivalent à) la logique du premier ordre plus ou moins étendue, et produisant, à partir d'un énoncé en langue naturelle, une requête (de type SQL -le langage d'accès à des bases de données par exemple) à une base de connaissances. Notre objet principal va être ici de montrer que cela est notoirement insuffisant! En effet, cette évolution des applications informatiques s'accompagne d'une modification profonde des modalités d'interaction homme-machine. Aux modes de communication désormais classiques (suites de menus ou de formulaires, grilles, séquences de questions-réponses ou de commandes) se substitue un véritable dialogue coopératif. La langue devient ainsi un outil fondamental et irremplaçable pour la

-

13

Machine, langage et dialogue

communication. C'est en effet le seul moyen de communication qui permet de créer une nouvelle situation de communication, de modifier dynamiquement la situation de communication courante et de la prendre comme thème du discours même. Nous ne prétendons pas que toute communication hommemachine doit systématiquement utiliser une langue naturelle, mais il est des situations où celle-ci est indéniablement utile: en particulier quand l'utilisateur est incapable d'expliciter précisément ses besoins, quand il refuse d'apprendre un code rébarbatif, quand la tâche n'est pas bien spécifiée, ou encore avec des interfaces non conviviales. Qu'il recherche des informations, veuille les manipuler ou en fournir à la machine, ou encore qu'il attende de cette dernière une aide à la réalisation d'une action, l'utilisateur établit un certain type de relation entre lui et le système: dans certains cas, la machine joue le rôle d'un intermédiaire permettant de remplacer un langage formel pour communiquer avec un autre système informatique. Dans d'autres, elle joue le rôle d'un assistant pour aider à se servir d'un autre système (éventuellement informatique, mais pas forcément). Enfin, toute une classe d'applications demande d'importantes facultés d'accès à l'information. Le principal objectif de l'informatique linguistique est donc d'intégrer au mieux l'ordinateur au sein des sociétés humaines. L'argument clef en faveur de la langue comme moyen de communication entre I'homme et l'ordinateur réside dans la flexibilité des langues verbales. Mais, il ne faut alors pas l'éliminer! Au lieu de considérer la flexibilité des langues comme un obstacle à résoudre par une limitation adéquate des domaines d'application, il faut s'y attaquer de front afin de garantir l'ergonomie de la communication, ce qui implique qu'il faut permettre l'usage de toute la langue (c'est-à-dire prendre en considération tous les phénomènes des langues naturelles, des anaphores aux métaphores et métonymies, en passant par les ellipses, déictiques...); il est pratiquement impossible, sauf dans des cas spécifiés. à l'extrême, de définir des sous-langages limitatifs. 14

Introduction

TI convient ainsi de souligner les différences essentielles que les produits envisageables dans le court terme entretiennent avec le dialogue homme-machine en toute généralité: ils utilisent un modèle du monde figé (ce qui permet de réduire le monde réel à sa représentation, et ainsi de n'être jamais surpris de ce qui s'y passe - réduction que ne permet pas un monde évolutif comme il devrait l'être), ils n'utilisent pas de modèle fin de l'interlocuteur, et les aspects pragmatiques, quand ils sont pris en considération, sont pratiquement prédéterminés.

1.5 Vers de nouvelles perspectives
On peut alors imaginer que les questions à long terme, qui demandent de nouveaux modèles et de nouvelles techniques sont les suivantes (ce qui recouvre, en gros, les points centraux des chapitres du présent livre) : 1) Le sens . Le rôle des symboles en intelligence artificielle (c'est le problème actuel de l'ancrage des symboles, lié à l'attribution du sens par l'intermédiaire des liens entre perceptions et actions; dans le cadre du langage, il pose la question des relations entre le sens et les concepts, les signes et les symboles. Nous essaierons de voir comment tenter de répondre aux critiques de Searle, Dreyfus...) ; . La référence (en liaison avec l' évolutivité nécessaire du monde de référence représenté, le traitement de la référence devient extrêmement complexe; en particulier les référents évolutifs posent des problèmes qu'on ne sait pas bien modéliser et que les techniques informatiques actuelles ne savent pas bien gérer.) ; 2) L'intentionnalité, en ce qu'elle vise à attribuer une signification à un énoncé, est liée au point précédent. Elle demande que l'intention communicative soit réellement découverte et qu'on ne se limite pas au seul sens littéral. Cela impose que la machine sache dégager le sujet général de la discussion, et déduire de ces informations le but et le 15

Machine, langage et dialogue

3)

plan éventuel de l'interlocuteur (quel est son problème réel et comment il envisage de le résoudre). Divers mécanismes de planification et de gestion de la mémoire sont nécessaires pour ce faire; Le rôle de l'apprentissage dans l'appropriation de la langue. Une réelle compréhension implique une confrontation continuelle entre les énoncés reçus et les connaissances antérieures. Là aussi, les mécanismes de dialogue jouent un rôle tout particulier par rapport à deux questions essentielles: comment on apprend par l'intermédiaire de la langue et comment on apprend à dialoguer par le dialogue lui-même.

Le cadre qui semble actuellement le plus prometteur pour donner des réponses aux trois types de questions évoquées cidessus, est celui des sciences cognitives. Différentes disciplines sont bien entendu concernées par les études sur la langue et devraient toutes intervenir dans la communication hommemachine par une langue naturelle: . Les linguistes cherchent à identifier les phénomènes caractéristiques du langage et des langues dans toute leur étendue et à en donner des descriptions, plus ou moins formelles selon les théories. Il s'agit de mettre en évidence les règles et les inventaires qui fournissent une description structurelle ou fonctionnelle du langage et qui, utilisées par un sujet, fondent sa compétence linguistique. . Pour l'intelligence artificielle, tout au moins sa partie la plus ambitieuse (Strong Al), le but des travaux sur la langue est de donner à la machine des capacités cognitives qui permettent une communication efficace. Il ne s'agit pas d'une duplication des capacités humaines mais d'arriver à déterminer les conditions d'une cognition artificielle. Même si ces aspects cognitifs sont à certains niveaux fondamentalement différents de ceux des hommes, l'hypothèse de base est qu'à d'autres niveaux de description ils sont analogues. . Les logiciens, eux, tentent de construire des formalismes

permettant des représentations fondées sur des théories
16

Introduction

mathématiques: à une syntaxe rigoureuse est attachée une sémantique formelle agréable à manipuler, mais souvent trop rigide pour les besoins des langues. . .

.

Les psychologues

sont également concernés par le langage:

notamment, les psycholinguistes qui cherchent à identifier les opérations mentales nous permettant d'engendrer des énoncés verbaux et de comprendre ceux qu'on nous adresse. Ils s'intéressent surtout aux énoncés effectivement prononcés et tentent d'expliquer la performance linguistique d'un individu à partir de sa compétence. Toutefois le langage de par sa complexité, engage non seulement la psycholinguistique mais toutes les formes de la psychologie. Ainsi, ne peut-on, par exemple, négliger les aspects sensoriels et moteurs et se concentrer exclusivement sur les processus centraux. Il faut aussi expliquer comment le sujet utilise le lexique et la syntaxe de sa langue en liaison avec les structures sémantiques manipulées et mesurer l'influence de notions extra-linguistiques, en particulier celles qui sont liées à la situation de communication. . Les neurosciences ont un rôle un peu particulier puisqu'elles se fondent sur une démarche plus analytique, en tentant d'expliquer les phénomènes au niveau le plus élémentaire (neuronal) pour rendre compte des mécanismes complexes du comportement par intégrations successives. On peut alors se demander s'il est possible de comprendre les processus cognitifs à partir d'une modélisation neuronale ou s'il n'existe pas de sauts qualitatifs entre des niveaux différents qui exigeraient des changements de perspective. À l'inverse, il est clair qu'il faut tenir compte des contraintes que le fonctionnement matériel du système nerveux impose au fonctionnement de l'esprit. Il convient ainsi d'examiner de très près les relations possibles, en repoussant aussi bien tout fonctionnalisme que tout réductionnisme.

17

Machine, langage et dialogue

1.6 Différents éléments de solution: vers une pratique commune
Les auteurs du présent livre ont tous une expérience pluridisciplinaire de longue date, tant à l'intérieur de leur équipe que grâce à des contacts nombreux au sein des sciences cognitives. Ils ont également approfondi les aspects du traitement automatique des langues depuis de longues années, avec des approches qui, si elles sont quelque peu distinctes, restent très cohérentes, par les intérêts et présupposés communs qu'elles entretiennent. Sans qu'il soit question d'une quelconque exhaustivité ni d'une représentativité de l'ensemble des recherches françaises, notre justification, et ce qui fonde notre rencontre, est la constatation d'une pratique commune dans ce domaine (rôle primordial des aspects pragmatiques, recherche de modèles ayant une certaine validité cognitive, tests par l'intermédiaire de réalisations concrètes.. .). La constatation que les traitements actuels restent très techniques, même lorsqu'ils intègrent des réflexions linguistiques, les a poussés à se tourner vers les fondements du langage par l'intermédiaire de collaborations avec des psychologues et des neurobiologistes pour construire les modèles sur lesquels ils s'appuient. L'intelligence artificielle a besoin des sciences humaines, et en particulier de la psychologie, pour réaliser toute son ambition initiale et cette collaboration passe par la construction d'objets communs. Ainsi, ce livre veut-il d'une part éclairer les sciences du langage par l'intermédiaire d'une contribution majoritairement externe à ce domaine, mais il veut aussi, d'autre part, réaliser une analyse épistémologique de cette rencontre, montrant cette élaboration d'objets communs et rendant patent le bénéfice qu'on en tire. Partant du fait que les capacités langagières sont essentielles à l'intelligence humaine, le premier chapitre (La langue et la communication homme-machine,. état et avenir-

18

Introduction

Gérard Sabah) soutient que le langage doit être considéré comme une (la ?) composante indispensable de l'intelligence artificielle. À travers une réflexion sur le rôle du langage dans l'intelligence et dans la modélisation de connaissances, ce chapitre tente de montrer la nécessité des mécanismes informatiques de la réflexivité et comment ils peuvent être considérés comme une imitation embryonaire de la conscience. Il analyse enfin les possibilités d'utiliser des travaux de neurobiologie pour fonder réellement la sémantique sur la base de perceptions et de réactions motrices, et comment cela peut répondre de façon intéressante au problème de l'ancrage des symboles. L'intelligence artificielle classique tente de résoudre ces questions en se fondant sur des modèles purement formels, et, si nous ne sommes pas d'accord avec les conclusions de Dreyfus..., nous pensons avec lui que cela complique énormément le problème (cf.. Norman 1993). En effet, vouloir développer une intelligence désincarnée nécessite un ensemble phénoménal de connaissances, de planification, de prises de décision, et une mémoire permettant un stockage et une recherche très efficaces, alors que la mémoire humaine est plutôt organisée autour des pôles importants pour la vie. Il n'est pas nécessaire pour nous d'être tout à fait exact; et c'est le contraire pour les machines. Le vrai problème est alors: comment structurer le monde pour que nous n'ayons pas à nous remémorer des choses inutiles? (ce qu'il faut, ce n'est pas une organisation a priori, mais plutôt des moyens d'accéder directement à l'information voulue). Par ailleurs, si ces manipulations purement formelles peuvent permettre de développer des techniques utiles pour les industries de la langue, le manque de dynamisme des modèles logiques les rend difficilement extensibles à tous les aspects de la cognition, et permettent mai d'envisager un vrai dialogue homme-machine. Après une explicitation des limites de la linguistique, les aspects psychologiques sont développés dans le deuxième chapitre (Pour une psychologie du dialogue homme-machineJean Vivier). Par rapport aux problèmes précédents, quelques solutions envisageables et cognitivement fondées sont 19

Machine, langage et dialogue

évoquées. L'accent est mis sur les aspects de référenciation et d'apprentissage. En particulier, sont abordées les questions liées à la représentation des connaissances propres au partenaire, à l'interaction et au mécanisme spécifique de construction de référence (dans quelles conditions deux partenaires peuvent-ils rendre compatibles les résultats de leurs processus de catégorisation 7). Ces questions servent de fondements à une réflexion sur la prise en considération des variations inter-sujets et sur la réflexivité du dialogue (dans quelle mesure le dynamisme du dialogue dépend-il du dialogue lui-même, qu'est-ce que la psychologie peut en dire... 7). Anne Vilnat, dans le troisième chapitre (Quels processus pour les dialogues homme-machine ?) prend en considération diverses spécificités des mécanismes fondant les dialogues. Ses réflexions se fondent sur une présentation historique et critique des réalisations actuelles, explicitant les grandes tendances qui ont amené l'état actuel des choses, mais aussi en quoi ils sont réducteurs quant au langage lui-même. Elle développe plus particulièrement la problématique des dialogues où les connaissances des interlocuteurs sont différentes, et où la situation n'entraîne pas forcément une attitude coopérative. Elle évoque également les relations entre l'apprentissage et la découverte de connaissances spécifiques chez le partenaire. Sur tous ces points, la question de la planification joue un rôle très particulier qui est approfondi et détaillé, en particulier à travers quelques exemples de programmes en cours de réalisation au LIMSI. Le troisième chapitre (Quelles références dans les dialogues homme-machine? - Jean-Marie Pierrel et Laurent Romary) se fonde également sur une analyse critique des premiers systèmes de dialogue et pose le problème particulier du dialogue oral et des dialogues naturels finalisés. Les hypothèses de base sont que ni la structure de la langue d'une part, ni la structure cognitive de l'utilisateur ne sont en relation bijective avec les structures des commandes élémentaires de l'application. Ils montrent ainsi la nécessité d'un traitement fin de la référence, et plus particulièrement des références spatio20

Introduction

temporelles, en distinguant références aux actions et références aux objets. Là aussi, la nécessité d'une modélisation en termes d'état final est soulignée, ainsi que les mécanismes de planification qui la sous-tendent. Faisant echo aux conclusions du premier chapitre, les auteurs essaye de mettre en évidence une vision unifiée du traitement de la référence, reposant sur des mécanismes de localisation et de différentiation qui semble caractériser des mécanismes cognitifs plus globaux. Enfin, Jean Vivier et Anne Nicolle (Dialogue et pluridisciplinarité: l'expérience de Compérobot) proposent une approche expérimentale de la modélisation du dialogue et illustreront les aspects précédents dans le dernier chapitre, avec le projet Compérobot. Alliant linguistique, pragmatique, psychologie du langage et intelligence artificielle, ce projet montre le bénéfice que l'on peut tirer d'une approche pluridisciplinaire et des sciences cognitives. Ils précisent ainsi quelles demandes peuvent être formulées aux diverses disciplines, quels types de réponses on peut en attendre et quelle méthodologie est souhaitable pour la mise en œuvre des futurs systèmes de dialogue homme-machine.
1. Bien que cela semble très ardu et reste discutable, nous tentons de défini,r ce terme un peu plus précisément. Par pragmatique, nous entendrons ici globalement l'étude de l'influence de la situation sur le sens du discours des intervenants. On peut donc considérer que la pragmatique recouvre l'usage que des interlocuteurs, visant à interagir entre eux, font effectivement de la langue, et on peut la diviser en deux aspects distincts : - comment l'information apportée par un énoncé s'intègre-t-elle aux connaissances que l'on a sur le monde de référence? (culture commune nécessaire aux interlocuteurs pour se comprendre en laissant nombre d'informations implicites); - dans quelle mesure le contexte d'énonciation influe sur le sens de la phrase prononcée? (cela recouvre d'une part, les aspects conventionnels des langues et d'autre part, les implications non conventionnelles dont, en particulier, les « implicatures conversationnelles », parfois involontaires.

21

2. La langue et la communication hommemachine, état et avenir
Gérard Sabah
Groupe Langage et Cognition
LIMSI

- CNRS

Après avoir précisé diverses façons de considérer le langage (vu principalement comme moyen de transmettre de l'information, ou comme élément essentiel de l'adaptation par la communication - entre individus), nous indiquerons quelques aspects spécifiques des traitements automatiques: le rôle particulier de la langue dans une communication hommemachine, les problèmes qui sont abordés dans le traitement automatique des langues, et les techniques classiques utilisées pour les résoudre. Nous montrerons ensuite comment l'intelligence artificielle distribuée permet une mise en œuvre d'une certaine réftexivité - capacité pour un programme de représenter son propre comportement et de raisonner à son propos - à notre sens fondamentale pour la compréhension du langage. Enfin nous donnerons quelques pistes pour une véritable sémantique qui se fonde sur certains aspects perceptifs et neurobiologiques, et nous mettrons en relation ces éléments avec la notion de conscience qui nous semble devoir être un point clef des recherches à venir sur les sciences cognitives et plus particulièrement le traitement automatique des langues.

Machine, langage et dialogue

2.1 Introduction Comme cela a déjà été souligné le chapitre précédent, le développement d'applications informatiques interactives concernant des tâches cognitives complexes ont entraîné une modification profonde des modalités d'interaction hommemachine. Les modes de communication classiques mais peu flexibles (suites de menus ou de formulaires, grilles, séquences de questions-réponses ou de commandes) peuvent être remplacés par un véritable dialogue coopératif utilisant la langue naturelle, seul moyen qui permet des auto-références et une modification dynamique de la situation de communication. Cette flexibilité des langues verbales est cependant parfois considérée comme un «défaut» auquel les processus informatiques se doivent de remédier, ce qui est souvent réalisé par une limitation adéquate des domaines d'application. .. Si l'on souhaite développer des méthodes plus facilement généralisables et qui abordent les vrais problèmes de front, il devient patent qu'une sémantique objective et universelle qui considère les connaissances comme des axiomes, et la construction du sens comme un processus exclusivement rationnel - n'est pas très utile du point de vue technologique, car elle ne conduit pas à des implantations flexibles et ergonomiques (les résultats obtenus dans des conditions d'expérimentation excessivement contrôlées ne peuvent pas s'extrapoler à des situations de communication réelles). Pour garantir l'ergonomie des interprétations construites par la machine, c'est-à-dire, leur conformité aux attentes des utilisateurs, le fonctionnement du système mis en œuvre doit être analogue à celui de la cognition humaine. Ainsi, que l'on veuille communiquer avec la machine ou communiquer avec d'autres individus ou d'autres systèmes par son intermédiaire, elle a besoin de facultés lui permettant de dialoguer efficacement. Le but de l'informatisation d'un tel système est alors de concilier dans un tout cohérent les connaissances sur la cognition, actuellement disponibles de façon très lacunaire, et 24

Langue

et communication homme-machine

de révéler ainsi des problèmes difficiles à prévoir au moyen d'une étude in abstracto du modèle proposé. C'est pourquoi l'informatique linguistique ne doit pas être considérée comme une simple technologie au service d'une discipline scientifique déjà bien consolidée: par sa portée heuristique, elle s'inscrit simultanément dans la démarche propre aux sciences de l'ingénieur et dans les sciences cognitives.

2.2 Langage et communication
La pragmatique concerne l'usage du langage en général; nous en distinguerons ici un sous domaine particulier: l'usage du langage pour communiquer. Nous tenterons, dans les paragraphes qui suivent de l'articuler par rapport principalement à quatre conceptions de l'étude du langage: . la recherche de régularités structurelles, allant des phonèmes aux textes (essentiellement le domaine de la linguistique) ; la recherche de correspondances entre les structures linguistiques et le monde (abordée par la philosophie du langage et l'intelligence artificielle) ; . la recherche de régularités pertinentes sur l'ensemble des processus cognitifs (considérée par la psychologie cognitive et l'intelligence artificielle) ; le domaine des actions et des interactions sociales (les recherches les plus récentes dans ce cadre portent sur l'étude des engagements produits par ce qu'on dit, vis à vis des partenaires dans la communication).

.

.

2.2.1 Communication et information
Une première conception naïve de la communication est issue de la théorie de l'information (Shannon 1938, Weaver 1955). Avec une telle conception, l'énonciateur a dans l'esprit un message qu'il veut transmettre et des règles d'encodage. L'application de ces règles lui permet de produire une

25

Machine, langage et dialogue

expression censée coder le sens de ce message. L'auditeur utilise alors un processus de décodage qui lui permet d'identifier les sons produits, les structures syntaxiques utilisées, les relations sémantiques correspondantes et de combiner tous ces éléments pour reconstruire le sens du message compris. Ce modèle est fondé sur des caractéristiques de bon sens des échanges langagiers, par exemple, le fait que la communication est réussie quand le message reconnu est identique au message initial (et comme corollaire qu'elle est en échec quand les deux messages diffèrent). Le langage est vu comme un pont entre les interlocuteurs, pont grâce auquel les idées privées sont communiquées par l'intermédiaire de sons publics.

Figure 2.1. Le sens considéré comme contenu dans le message émis par le locuteur

(Reddy 1979) recense par ailleurs de l'ordre de 80 métaphores renforçant la pensée du langage comme un « conduit par lequel des idées transitent» (ce texte est plein d'émotions, trouvez-vous une idée intéressante dans cet article ?.. .). Selon Reddy, les idées suivantes structurent ces métaphores: (1) le langage est un intermédiaire qui permet de transmettre des idées d'une personne à une autre (2) en écrivant et en parlant, les gens insèrent leurs pensées et leurs sentiments dans les mots

26

Langue

et communication homme-machine

(3) les mots assurent le transfert en transportant ces pensées et sentiments (4) en écoutant ou en lisant, les gens extraient ces pensées et ces sentiments des mots. Ce modèle suppose en conséquence que l'intention communicative est identique au sens littéral du discours produit et peut être reconnue à partir de la grammaire et des conventions de la langue: la communication est possible car l'intention communicative est considérée comme une partie conventionnellement codée dans le message lui-même. Cependant, bien qu'intuitivement correctement fondé et attractif, ce modèle, comme l'observe Hamish (1985), pose divers problèmes. Considérons-en successivement quelquesuns. Tout d'abord, il n'explique pas à lui seul comment l'auditeur détermine la signification pertinente d'une expression linguistiquement ambiguë; pour ce faire, l'auditeur doit se fonder sur le fait que l'énoncé du locuteur est contextuellement approprié à la situation. La remarque précédente s'applique aussi bien aux phrases ayant plusieurs interprétations qu'aux références liées au contexte - par exemple, comprendre qui le président désigne dépend du pays comme de la période, éléments qui ne sont pas forcément déterminés par le sens des expressions linguistiques employées. Le modèle doit dont être complété par des principes de traitement contextuel de l'ambiguïté et de la référence. C'est . principalement ce à quoi se sont attachés Jean-Marie Pierrel et Laurent Romary dans le chapitre 5 en approfondissant cette question de la référence et en considérant essentiellement la langue comme moyen de communication dans le cadre d'applications informatiques finalisées. La flexibilité sémantique ne se limite pas à la diversité des dénotations. Par exemple, dans l'expression un apéritif sans alcool, l'unité apéritif ne manifeste pas le trait typique avec alcool (Nossin 1989). Remarquons que sans alcool est un sélecteur opérant non pas sur le référent, mais sur le signifié de apéritif. En effet, une sélection référentielle conduirait à 27

Machine, langage et dialogue

l'ensemble vide, car apéritif dénote une boisson alcoolisée que l'on prend avant un repas, or il n'existe aucune boisson alcoolisée sans alcool. Ce genre d'énoncé n'est donc pas interprétable dans un modèle à référence directe. En outre, certaines expressions linguistiques, comme à la Saint GlinGlin, sont par définition non référentielles. Un niveau intermédiaire non référentiel autorisant un calcul sémantique semble indispensable. Ensuite, ce modèle ne distingue pas le sens littéral de l'intention communicative, alors que celle-ci n'est pas déterminée de façon unique par celui-là; ainsi, on pourrait supposer l'existence d'une signification éventuellement différente du sens littéral, mais outre qu'elle ne figure pas dans le modèle, celui-ci ne permet pas d'expliquer comment la construire. Prenons avec Martin (1983), l'exemple de la phrase toute simple: je reviendrai. À la fin d'une visite amicale, elle représente une promesse; dans la bouche d'un client d'un restaurant, ce sera un compliment; ce sera l'avertissement d'un policier s'adressant à un automobiliste mal garé; une menace prononcée par un propriétaire qui s'en retourne sans avoir été payé; une prédiction consolatrice d'un soldat qui part au front.. . De façon encore plus extrême, le modèle présenté ne rend pas compte non plus des situations où nous voulons dire autre chose que le sens textuel de ce que nous disons effectivement (ironie, sarcasmes, métaphores. ..), et on sait bien que ce sont là des caractéristiques essentielles et fondamentales des langues humaines. À partir du moment où le sens littéral peut n'avoir

aucune pertinence dans la situation

(<< Quel

bonheur!» en

constatant qu'un des pneus de sa voiture est crevé I), c'est là un problème pratiquement insoluble pour ce modèle. Un dernier problème concerne le fait que communiquer un message n'est pas toujours le but de nos paroles, comme cela fut souligné par la mise en évidence des performatifs: il n'y a aucune intention communicative dans le fait de renvoyer ou de baptiser quelqu'un, ou même, de façon moins conventionnelle, de juger quelqu'un pour un jury, mais seulement action. 28

Langue

et communication homme-machine

Ainsi, et pour synthétiser, dans ce premier modèle, le rôle essentiel du langage est de représenter un monde qui lui préexiste. La langue elle-même est considérée comme un objet qui possède une structure interne cohérente et peut être étudiée indépendamment de son usage. Toutefois, toutes les remarques précédentes indiquent qu'il faut plus qu'un langage commun pour qu'un auditeur puisse identifier l'intention réelle qu'un locuteur veut communiquer. En outre, comme les différents mécanismes du processus de compréhension sont supposés se déclencher dès le début de la production, les contraintes temporelles et la rapidité de la compréhension impliquent que l'architecture sous-jacente est séquentielle.
MONDE DE

RÉFÉRENCE

Compréhension Langue Production

STRUCTIJRES DE
REPRÉSENTATION

MONDE SYMBOLIQUE

Inférences

-

Figure 2.2. Modèle 1 : le rôle de la langue est de représenter un monde qui lui préexiste. Les structures de représentation, issues des éléments langagiers, sont alors supposées « représenter» le monde de la même façon. Même si les programmes actuels ne disposent ni de perception ni de moyen d'action réels sur le monde, les opérations sur ces représentations sont censées refléter des opérations effectuées dans le monde.

29

Machine, langage et dialogue

Pour ce qui concerne les mises en œuvre informatiques, cela signifie que la compréhension est vue comme un ensemble de transformations successives d'un langage de représentation dans un autre. Cela correspond aux premiers modèles de traitement automatique des langues développés par l'intelligence artificielle, où, comme on le voit Figure 2.2, les phrases de la langue sont supposées correspondre à des faits réels. On suppose en outre qu'il est possible de créer un système formel de représentation tel que (a) pour chaque fait il existe une formule du système de représentation, (b) chaque phrase peut être liée à une telle formule et (c) des calculs formels sur ces représentations simulent les raisonnements sur les faits du monde. Les opérations réalisées sur les structures de représentations ne se justifient pas par rapport à la langue, mais par les correspondances entre ces représentations et le monde représenté; on peut d'ailleurs remarquer que ce modèle correspond à celui pour lequel des philosophes du langage comme Frege (1892) avaient argumenté bien avant l'apparition de l'intelligence artificielle! Une différence essentielle reste que l'immense majorité des systèmes d'intelligence artificielle est totalement dépourvue de moyens de perception et d'action sur le monde réel: fondamentalement, le programmeur sert d'intermédiaire lors de la construction des représentations, ce qui modifie complètement le processus cognitif que l'on cherche à modéliser. Ces systèmes supposent (généralement implicitement) que les mécanismes d'analyse, production et inférences fondées sur des systèmes symboliques plus ce lien avec une interprétation humaine implicite et externe peuvent suppléer cette absence de perception et d'action... Il faut alors se demander si ces processus ne sont pas des préalables nécessaires à tout sens; nous indiquons, en fin du présent chapitre, quelques propositions de solution en cas de réponse positive à la question précédente. Cette quête du sens s'est retrouvée principalement dans les premiers programmes de traitement automatique des langues, que nous analysons de plus près ci-dessous. 30

Langue

et communication homme-machine

2.2.2 Traitement automatique des langues
La première question qui s'est posée fut de définir ce que peut signifier compréhension pour une machine. Examinons-en quelques réponses possiblesl à partir du seul problème consistant à répondre à des questions, dans un cas simplifié à l'extrême. Si j'ai donné l'information Pierre est le frère d'Annie, et si je demande (a) Est-ce que Pierre est le frère d'Annie?, il suffit de comparer les caractères des six derniers mots de chaque phrase pour pouvoir répondre oui, sans rien comprendre de plus. Certaines mises en correspondance de symboles suffisent donc parfois à simuler la compréhension. Les limites en sont claires: il suffit de demander (b) Annie a-t-elle Pierre pour frère? pour que ça ne marche plus! Il est alors nécessaire de construire des représentations relativement indépendantes de la forme même des informations et des questions. La représentation est ainsi un ensemble de symboles portant une partie de la signification de la phrase; il s'agit donc à la fois d'une simplification (l'ensemble du sens n'est pas traduit) et d'une uniformisation de cette signification (plusieurs phrases différentes peuvent avoir la même représentation). Ces représentations sont généralement construites grâce au principe de compositionnalité: les sens des mots sont représentés par des symboles, et on combine ceux-ci entre eux afin de représenter le sens de la phrase entière (il faut noter que ce mécanisme est quelque peu restrictif et ne permet pas de rendre compte de toutes les finesses de l'utilisation du langage. ..). Ainsi, par exemple, on peut considérer que le mot frère

correspond à un prédicat FRÈRE (un symbole de logique
mathématique représentant par convention le sens de ce mot) qui s'applique à deux arguments; la première phrase correspond alors à FRÈRE(Pierre, Annie), ce qui traduit un certain niveau de compréhension. Cette représentation sera obtenue par une analyse linguistique qui détermine le sujet de la phrase et le complément du nom frère. Grâce à une telle analyse, les deux questions (a et b) ci-dessus se traduisent alors

31

Machine, langage et dialogue

sous la même forme [FRÈRE (Pierre, Annie)], donnant ainsi aisément la réponse. Si on veut aussi répondre à Annie est-elle la sœur de Pierre?, tester la seule coïncidence des représentations ne suffit plus. Il faudra également utiliser des propriétés liées aux mots mis en jeu (Annie étant féminin, sœur se réfère à une situation symétrique ce qui permet de déduire que FRÈRE (Pierre, Annie) est équivalent à muR (Annie, Pierre). Des connai~ances générales sur le monde peuvent enfin être nécessaires: si je demande Pierre et Marie vivent-ils dans la même maison? il va falloir tenir compte des usages de la vie de famille, ainsi que de la situation au moment où l'on parle (quel âge ont-ils? l'un d'eux est-il marié? ..) et mettre en œuvre des raisonnements plus élaborés. Ce simple exemple suggère quelques notions sur les techniques utilisées ainsi que la complexité des problèmes posés par la compréhension automatique des langues. Dans la conception actuelle de la plupart des programmes de compréhension des langues, on suppose l'existence du sens littéral d'un énoncé (cela correspond à la thèse intuitive, communément admise, qu'une phrase donnée possède un sens - ou plusieurs, en cas d'ambiguïté), et on en construit une représentation à l'aide de symboles plus élémentaires. Cette première étape est le résultat du processus par lequel on essaye de comprendre ce que dit l'interlocuteur (la compréhension de pourquoi il le dit sera réalisée ensuite). Quel que soit le formalisme employé pour construire cette représentation (qu'il s'agisse des structures profondes du linguiste, des formules bien formées du logicien ou des descriptions componentielles du psychologue), et même si ce fonctionnement semble linguistiquement et psychologiquement fondé (on arrive effectivement à formuler une même idée de diverses façons), il reste discutable puisque le sens d'une phrase est difficile à déterminer a priori et doit plutôt être calculé d'après le contexte où cette phrase apparaît. (Kayser 1984) propose de plus amples développements sur ce point. ' 32

Langue

et communication homme-machine

Plus précisément, trois niveaux de difficultés apparaissent, qui concernent respectivement le lexique (informations sur les mots et leurs sens), la grammaire (structures des phrases, comment les sens des mots se composent) et enfin les connaissances externes (informations générales sur le monde, sur la situation particulière). La première capacité à donner aux programmes de traitement automatique des langues est de reconnaître les mots de la langue. S'il est devenu possible d'informatiser des lexiques correspondants aux dictionnaires usuels (environ 50000 mots, c'est-à-dire 350000 formes fléchies), couvrir l'ensemble des domaines techniques reste en dehors de notre portée. Il faudrait en effet, tâche de Titan!, décrire les caractéristiques grammaticales de quelque 5 millions de mots. De plus, définir ce qu'est un mot (une entrée d'un dictionnaire) n'est pas aussi simple qu'il y paraît (Laporte et Silberztein 1989), avec les mots composés, les expressions toutes faites, les noms propres, les néologismes, les mots étrangers et les abréviations, sans parler des complications artificielles dues aux typographies pauvres (par exemple, pas d'accent ni de cédille, lettres uniquement capitales du MINITEL, entraînant des confusions entre des mots comme cote, coté, côte, côté). Au niveau suivant, il faut expliciter les rôles des différents mots dans la phrase, ainsi que les relations qu'ils entretiennent. Certains problèmes difficiles (conjonctions, comparatifs, ellipses. . .) sont encore mal résolus, et les théories linguistiques n'explicitent généralement pas les interactions qui existent entre eux. Même s'il n'existe actuellement aucune grammaire complète d'aucune langue parlée, l'aspect pluridisciplinaire est très présent ici puisque nombre de travaux en linguistique tiennent maintenant grand compte des contraintes dues à leur utilisation sur ordinateur. Parallèlement ou postérieurement à la reconnaissance de la structure syntaxique est construite une formule censée exprimer le sens de la phrase, par combinaison des symboles qui représentent les sens, plus élémentaires, des mots de la phrase. La logique, et surtout ses extensions dites « non-classiques» traitant des phénomènes complexes, est un 33

Machine, langage et dialogue

système formel souvent choisi pour produire ces formules. D'autres outils (réseaux sémantiques, schémas...) ont également été développés en vue de s'affranchir des contraintes formelles de la logique et de permettre des mécanismes plus souples; ils entretiennent des relations complexes avec cette dernière, relations qui sont maintenant l'objet de diverses études théoriques. Une telle formule veut représenter 1'hypothétique sens littéral de la phrase, qu'il est généralement nécessaire de dépasser pour comprendre réellement; des inférences sont nécessaires pour calculer la signification effective du discours. Conformément à la première vision du langage présentée cidessus (le langage vu comme un objet et la compréhension comme une cascade de changements de représentations), des mécanismes ultérieurs vont alors calculer les interprétations possibles. Toutes nos connaissances sont nécessaires lors de la compréhension: la réalité et ses contraintes, les aspects culturels, l'observation de la situation concrète de communication, permettent de découvrir les sous-entendus cachés derrière l'énoncé à traiter. Toutefois, une telle maîtrise reste en dehors des moyens de calcul actuels et pose également une question d'architecture quant à la nécessaire compatibilité des diverses structures construites à tous ces niveaux distincts. Les traitements automatiques des langues impliquent, de plus, une différence avec la compréhension humaine en général: on n'utilise pas un ordinateur sans un but précis, on ne communique pas avec lui uniquement pour communiquer! Les aspects particuliers de l'application (les buts visés, la représentation de la tâche, les connaissances spécifiques du domaine...) sont alors des connaissances utiles pour permettre la mise en œuvre de programmes efficaces dans des domaines restreints ou bien formalisés. Si des outils efficaces de représentation ont été développés pour ce faire (schémas, scénarios, scripts.. .), des problèmes naissent de la très grande quantité de connaissances à utiliser. Retrouver l'information pertinente et ne pas se noyer dans des déductions inutiles sont, bien qu'essentielles, des questions encore ouvertes; certains 34

Langue

et communication homme-machine

soulignent même que c'est là le problème fondamental de l'intelligence artificielle (Fodor 1987). En d'autres termes, ce premier modèle considère que la compréhension d'un système automatique consiste à construire des représentations de plus en plus « profondes» de ce qui lui est dit. Profonde veut dire ici des représentations qui se rapprochent de plus en plus des représentations internes des connaissances générales qu'il a sur le monde (de référence). Ce point de vue est cohérent avec l'idée qu'un des moteurs des avancées de l'intelligence artificielle est la mise en place de différents niveaux de langage, de plus en plus complexes et compilés les uns dans les autres «Hofstadter 1979) - voir aussi (Desclés 1990) pour une application de ces idées au traitement automatique des langues). Savoir quelles relations existent entre ces niveaux reste toutefois une question ouverte qui s'est encore compliquée avec l'émergence de deux points de vue généraux sur les architectures cognitives: la modularité, telle qu'elle est défendue par (Fodor 1983) et le connexionnisme (par exemple, Rumelhart, et al. 1986)... Si l'on reste dans le cadre du cognitivisme, les travaux d'intelligence artificielle classique font l'hypothèse fondamentale que les processus de pensée sont mécanisables et peuvent être simulés sur ordinateur en transformant de l'information et en produisant, à partir de données, des résultats appropriés. Cette hypothèse revient à considérer que, pour l'intelligence humaine, le résultat de chaque opération du système nerveux peut être l'analogue d'une séquence d'opérations élémentaires. Or, on peut distinguer chez l'homme les activités cérébrales formelles (généralement scientifiques) de celles qui sont informelles (et le langage semble faire partie de celles-ci!). Pour ces dernières, il semble que les êtres humains opèrent directement sur des significations sans passer par un formalisme quelconque. L'adéquation du formel aux traitements automatiques des langues doit alors être examinée soigneusement. Ainsi, quelles qu'elles soient, des données sont toujours constituées de leur forme d'une part (leur support 35