Compréhension, apprentissage et catégorisation. Possibilités d automatisation : un point de vue d informaticien - article ; n°14 ; vol.7, pg 49-64
17 pages
Français

Compréhension, apprentissage et catégorisation. Possibilités d'automatisation : un point de vue d'informaticien - article ; n°14 ; vol.7, pg 49-64

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
17 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Faits de langues - Année 1999 - Volume 7 - Numéro 14 - Pages 49-64
16 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Sujets

Informations

Publié par
Publié le 01 janvier 1999
Nombre de lectures 27
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

Gérard Sabah
Compréhension, apprentissage et catégorisation. Possibilités
d'automatisation : un point de vue d'informaticien
In: Faits de langues n°14, Octobre 1999 pp. 49-64.
Citer ce document / Cite this document :
Sabah Gérard. Compréhension, apprentissage et catégorisation. Possibilités d'automatisation : un point de vue d'informaticien.
In: Faits de langues n°14, Octobre 1999 pp. 49-64.
doi : 10.3406/flang.1999.1264
http://www.persee.fr/web/revues/home/prescript/article/flang_1244-5460_1999_num_7_14_1264apprentissage et catégorisation Compréhension,
Possibilités d'automatisation :
un point de vue d'informaticien
Gérard Sabah*
Au sujet de l'informatique linguistique, il importe tout d'abord de souligner
une distinction importante entre compréhension automatique des langues et
traitement automatique des langues : avec compréhension, nous partons
essentiellement d'un point de vue cognitif, visant à simuler sur un ordinateur les
fonctionnalités mises en œuvre par l'homme lorsqu'il comprend (et plus
particulièrement une langue) ; il ne s'agit surtout pas seulement (comme cela
nous paraît être impliqué par le seul traitement) de la réalisation d'une
application quelconque se contentant d'utiliser des mots de la langue pour
faciliter l'interaction avec l'ordinateur.
Plus spécifiquement, le but de cet article est de montrer pourquoi, avec le but
de simuler sur ordinateur la compréhension d'une langue, catégorisation et
apprentissage sont essentiels, puis de proposer un modèle informatique (c'est-à-
dire implémentable) tenant compte de ces aspects.
1. RÔLE DE LA CLASSIFICATION ET DE L'APPRENTISSAGE VIS-À-VIS DE LA
COMPRÉHENSION
1.1. Catégorisation
Pour l'être humain, la catégorisation est essentielle parce qu'elle représente le
moyen principal par lequel nous donnons du sens à nos expériences vécues : elle
explique pourquoi chaque objet n'est pas considéré de façon unique et comment
se constituent ces catégories. Elle entretient un rapport étroit avec la langue :
catégorisation et dénomination sont généralement considérées comme
indissociables bien que cela soit à pondérer (ainsi, par exemple, on est capable
de distinguer de l'ordre de 1500 odeurs et très peu portent des noms explicites).
On distingue principalement le courant objectiviste (la catégorisation s'opère
sur la base de propriétés communes) du courant expérientialiste (la
catégorisation s'opère sur la base de mises en relief de similitudes globales et de
formation de prototypes de référence). Le premier, fondé sur le modèle
aristotélicien, suppose que les catégories ont des frontières clairement délimitées
et tous les membres d'une catégorie ont un statut identique. L'ensemble des
* Groupe Langage et Cognition, LIMSI- CNRS. Gérard Sabah 50
conditions nécessaires et suffisantes (CNS) pour qu'un élément appartienne à la
catégorie désignée par un mot est alors "le sens du mot". Bien que ce modèle
soit pratiquement le seul sous-tendant la sémantique des systèmes automatiques
de compréhension (ce qui est probablement dû à sa facilité de mise en œuvre), il
pose divers problèmes fondamentaux bien connus.
La sémantique du prototype (Rosch 1977) cherche à résoudre ces problèmes
en distinguant "le meilleur" exemplaire communément associé à une catégorie
(le meilleur exemplaire n'est pas un exemplaire particulier mais une sous-
catégorie). Une catégorie devient ainsi une classe ouverte, non contingente (où
il n'y a pas de limites claires pour les catégories). D'où une ressemblance de
famille : les membres d'une catégorie peuvent être reliés les uns aux autres sans
qu'il existe une propriété commune à tous. Ainsi, la base de l'opération de
catégorisation est un principe d'appariement et non une vérification de CNS.
1.2. Apprentissage
Une autre question fondamentale naît de l'approche même de l'intelligence
artificielle et de la linguistique informatique : celles-ci tentent de définir a
priori des mécanismes de représentation et des processus de raisonnement, afin
de réaliser des systèmes automatiques de compréhension et de production des
langues. La compréhension et le langage sont des phénomènes si complexes
qu'on tend à les examiner sans autre complication : on les étudie donc de façon
isolée en remettant à plus tard l'étude des interactions avec d'autres
phénomènes. Cela implique la nécessité d'un ensemble phénoménal de
connaissances, de planification, de prises de décision, et une mémoire
permettant un stockage et une recherche très efficaces (ce qui représente
l'essentiel des travaux d'intelligence artificielle et de traitement automatique
des langues, qui n'ont pas réellement essayé de trouver d'autre
solution . . . (Norman 1993)).
Or, c'est le langage même qui donne à l'homme ses facultés de représentation
et de raisonnement qui augmentent significativement ses capacités cognitives de
représentation et de raisonnement (qui, à leur tour et de façon recursive, servent
à développer un langage de plus en plus élaboré...). Une réelle compréhension
implique donc une confrontation continuelle entre les énoncés reçus et les
connaissances antérieures, stockées dans une mémoire non seulement
associative, mais aussi prospective et reflexive. Ainsi, l'intelligence artificielle
purement symbolique semble-t-elle prendre le problème à l'envers, le rendant
ainsi peut-être impossible par nature... Beaucoup d'arguments contre la
possibilité d'une intelligence désincarnée ont d'ailleurs été avancés. Une autre
voie consiste à tenter de donner à la machine la capacité de gérer un langage
élaboré avant de lui demander d'effectuer des raisonnements de niveau
supérieur qui restent des mécanismes nécessaires à la compréhension. Cet
aspect récursif du problème montre que l'apprentissage est ici primordial. Une
question centrale concerne alors l'architecture générale des programmes
d'intelligence artificielle: quelle structure prédéfinie permettrait à un tel
processus d'amorçage de se produire? apprentissage et catégorisation 51 Compréhension,
1.3. Langue et perception
Par ailleurs, ignorer l'existence de sensations néglige le fait que l'incarnation
est productrice de sens et qu'il est impossible d'avoir des états intentionnels
sans expérience subjective. Une sémantique "subjective", centrée sur l'individu,
serait ainsi plus utile pour modéliser de façon plus analogique les processus de
compréhension. On ne chercherait alors pas à représenter le sens comme un état
du monde de référence, mais comme une modification d'un état de
connaissance, c'est-à-dire, comme un effet sur le contexte cognitif du système.
Cela permettrait, d'une part, de traiter le problème du sens des symboles. En
effet, dans tous les systèmes d'intelligence artificielle actuels, les sens des
symboles manipulés leur sont attribués de l'extérieur, par le programmeur.
Même s'il est devenu banal de souligner que les symboles n'ont pas de
signification par eux-mêmes, rien ne permet encore d'approcher une
sémantique intrinsèque, bien que la question de l'ancrage des symboles
(Harnad 1990, Amy, et al. 1993) voie des développements récents.
Il semble donc fondamental d'examiner de plus près les liens entre les
significations et les perceptions afin d'expliquer comment un symbole permet
de reconstruire plus ou moins partiellement un état mental précédent, sans que
la scène représentée soit elle-même présente, puis de raisonner à propos de cette
scène.
2. SÉMANTIQUE ET CATÉGORISATION : QUELQUES ÉLÉMENTS POUR UN MODÈLE
IMPLÉMENTABLE
2.1. Une source d'inspiration neurobiologique
La thèse essentielle d'Edelman (1987, 1989, 1992) est que l'esprit est un
processus d'un type particulier qui dépend de certaines formes particulières
d'organisation de la matière. La matière de l'esprit interagit constamment avec
elle-même. C'est l'organisation dynamique des substances, et

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents