L organisation des connaissances
270 pages
Français

Vous pourrez modifier la taille du texte de cet ouvrage

L'organisation des connaissances

-

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
270 pages
Français

Vous pourrez modifier la taille du texte de cet ouvrage

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

L'organisation des connaissances évoque irrésistiblement les grandes classifications des bibliothèques et des encyclopédies. A l'heure où le texte intégral règne sans partage sur le web, on peut se demander s'il y a encore une place pour les outils de catégorisation, les plans de classement ou les thésaurus? La reconfiguration actuelle qui met la logique formelle au centre de l'organisation des connaissances doit-elle prendre la place occupée jusqu'à présent par la philosophie des sciences et l'épistémologie.

Sujets

Informations

Publié par
Date de parution 01 mai 2005
Nombre de lectures 279
EAN13 9782336260853
Langue Français

Informations légales : prix de location à la page 0,0005€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Exrait

Le « photocopillage » tue le livre
Le code de la propriété intellectuelle n’autorisant, aux termes de l’article L.122-5, 2 e et 3 e a, d’une part, que les « copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective » et, d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite » (art. L.122-4).
Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles L. 335-2 et suivants du code de la propriété intellectuelle.
L'organisation des connaissances
Approches conceptuelles

Yolla Polity
Gérard Henneron
Rosalba Palermiti
© L’Harmattan, 2005
9782747582742
EAN : 9782747582742
Liste des auteurs
Abascal Rocio, LIRIS — INSA de Lyon Arara Ahmed, LIRIS — Université Lyon 1 Bachimont Bruno, INA Bautier Roger, LABSIC — Université Paris 13 Benslimane Djamal, LIRIS — Université Lyon 1 Bouzidi Laïd, IAE — Université Jean Moulin — Lyon 13 Dancette Jeanne, Université de Montréal et Université de Genève David Amos, SITE-LORIA — Nancy Elkateb-Gara Faiza, LIMSI — CNRS Ertzscheid Olivier, URFIST — Université des sciences sociales de Toulouse Grau Brigitte, LIMSI — CNRS Hernandez Nicolas, LIMSI — CNRS Hudon Michèle, EBSI — Université de Montréal Hufschmitt Benoît, CDBP — Université de Franche Comté — Besançon Ibekwe Fidelia, ERSICO — Université Lyon 3 Ihadjadene Madjid, CRIS — Université ParisX—Nanterre Kislin Philippe, SITE-LORIA — Nancy Kovacs Suzan, Université Lille 3 Lecomte Alain, Université Pierre Mendès France — Grenoble 2 Léveillé Laurent, École des sciences de la gestion, Université du Québec — Montréal Link-Pezet Jo, URFIST — Université des sciences sociales de Toulouse Malaise Véronique, INA et STIM / AP-HP Periguiron Frédérique, SITE — LORIA — Nancy Pinon Jean-Marie, LIRIS — INSA de Lyon Pirolli Fabrice, IAE — Université Jean Moulin — Lyon 3 Polity Yolla, RI 3 -IUT2 — Université Pierre Mendès France — Grenoble 2 Roussey Catherine, LIRIS — Université Lyon 1 Roy Richard, BMVR — Reims Rumpler Béatrice, LIRIS — INSA de Lyon Sanjuan Éric, LITA — Université de Metz Soubrie Thierry, Université Stendhal — Grenoble 3 Vangenot Christelle, École polytechnique de Lausanne Zweigenbaum Pierre, STIM / AP-HP
Sommaire
Page de titre Page de Copyright Liste des auteurs Avant-propos Chapitre 1 - Histoire
Penser, classer, et la culture de l’imprimé, - L’index du livre imprimé au XVIe siècle Doctrinaires et saint-simoniens sur l’organisation des connaissances
Chapitre 2 - Langue, terminologie et formalisme
Extraction et typage de termes significatifs pour la description de textes Extraction d’entités nommées pour la recherche d’informations précises Les représentations lexico-sémantiques (RLS), moyen de structuration des connaissances dans les domaines spécialisés Annexes Spatialisation des concepts-objets du langage naturel dans un thésaurus illustré multilingue dédié à la traduction semi-automatique « Term Watch » : variations terminologiques et veille scientifique Caractérisation des éléments de solutions en recherche d’information : conception d’un modèle dynamique dans un contexte décisionnel
Chapitre 3 - Multidimentionnalité
Terminologie et multi-terminologie dans les écrits discursifs argumentatifs en langue naturelle Contribution à l‘interopérabilité dans les ontologies : la multi-représentation L’organisation des connaissances et la recherche d’informations dans une logithèque
Chapitre 4 - Ontologie et Thesauri
Vers une combinaison de méthodologies pour la structuration de termes en corpus - Premier pas vers des ontologies dédiées à l’indexation de documents audiovisuels Conception d’une ontologie dans le contexte d’une bibliothèque numérique De l’ingénierie des compétences à l’ingénierie des connaissances - Construction d’une ontologie pour la recherche d’information Macrothésauri et systèmes d’information gouvernementaux accessibles au grand public
Chapitre 5 - Bibliothèque et appropriation.
Classifications encyclopédiques et interface de recherche d’information Pour une approche « conviviale » de l’accès à distance aux collections des bibliothèques publiques L’apport d’Internet à l’organisation des connaissances - Vers un encyclopédisme d’usage AUKAPIWeb : Auxiliaire pour l’appropriation de l’information sur le Web - Du traitement automatique de l’information à sa manipulation
Comité scientifique
Avant-propos
La quatrième édition du Congrès d’ISKO-France ( International Society for Knowledge organization ) s’est tenue à Grenoble les 3 et 4 juillet 2003. Cet événement scientifique a été organisé avec le concours du groupe de recherche RI 3 (Recherche interactive et intelligente de l’information) et de l’IUT2 de l’Université Pierre Mendès France de Grenoble. Il a rassemblé une centaine de chercheurs, d’experts et de praticiens, venus de France, de Suisse et du Canada.
Les trois premiers congrès de Lille 1997, Lyon 1999 et Paris 2001 avaient eu respectivement pour thèmes « L’intégration des connaissances dans les systèmes de représentation et de recherche d’information », « L’indexation à l’heure d’Internet » et « Filtrage et résumé automatique de l’information sur les réseaux ». Le congrès de Grenoble a voulu privilégier un point de vue moins spécifique en traitant des « approches conceptuelles » de l’organisation des connaissances.
Ce choix n’était pas facile car nous savions tous qu’actuellement les approches conceptuelles ne sont pas des approches dominantes. Il nous a cependant semblé utile d’ouvrir un espace d’expression, d’échange et de discussion à des chercheurs et des professionnels confrontés à des problèmes que ne résolvent qu’en partie les outils de catégorisation automatiques. Les trois précédents congrès d’ISKO-France avaient largement exploré les voies de l’indexation et du filtrage, nous avions donc envie de revenir aux fondamentaux et d’aborder les questions théoriques posées par l’organisation des connaissances aujourd’hui.
Nous voudrions ici remercier le Conseil d’administration d’ISKO-France d’avoir accepté cette proposition et plus particulièrement son président Jean-Paul Metzger qui nous a toujours encouragé dans cette voie. Nous voudrions aussi remercier les membres du Comité scientifique dont le lourd travail d’évaluation des propositions de communication, de lecture des textes et de conseil aux auteurs a été déterminant. Notre gratitude va enfin et surtout aux contributeurs car c’est la richesse et la variété des approches qui ont assuré le succès de ces deux journées en montrant l’intérêt d’une ouverture interdisciplinaire dans un domaine trop souvent restreint aux chercheurs et aux praticiens des Sciences de l’information.
YOLLA POLITY 1

Introduction
L’organisation des connaissances évoque irrésistiblement les grandes classifications des bibliothèques et des encyclopédies avec leur idéal d’universalisme qui provoque fascination et inquiétude, et les défauts qui lui sont inhérents : vision globalisante, rigidité, structure systématique et hiérarchique, admirablement décrits dans les œuvres de Borges ou d’Eco.
En tant que domaine de recherche, elle ne se limite pas aux problèmes documentaires de classification et d’indexation. Elle se donne comme objets d’étude les processus cognitifs et les techniques intellectuelles qui permettent de classer, indexer, représenter, formaliser, modéliser le réel. Elle concerne donc tous les spécialistes confrontés à l’organisation des connaissances quel que soit leur domaine d’intérêt ou leur discipline : épistémologie, philosophie, pédagogie, édition, conception de produits ou de services, etc. et toutes les personnes invitées à utiliser et à s’approprier ces connaissances organisées. C’est cette large vision du domaine qui s’exprime dans la définition donnée dans l’appel à communication de ce congrès :

Par organisation des connaissances, il faut entendre :
Toutes sortes de schémas d’organisation allant des simples listes alphabétiques ou faiblement structurées (listes d’autorité, glossaires, dictionnaires, nomenclatures, etc.) à des schémas classificatoires hiérarchiques (plans de classement, classifications générales ou spécialisées, taxinomies, listes de vedettes matières, etc.) ou encore à des organisations privilégiant des relations non exclusivement hiérarchiques (thésaurus, réseaux sémantiques, ontologies, etc.), portant sur toutes sortes d’objets allant des documents au sens classique du terme (textes, images fixes et animées, enregistrements sonores, etc.) jusqu’à l’ensemble des phénomènes concrets ou abstraits que l’on peut avoir besoin de recenser, d’organiser et de traiter (objets, évènements, processus, etc.) et avec des buts et des objectifs divers : retrouver, enseigner, produire de nouvelles connaissances, communiquer, appliquer des traitements appropriés, etc.
En effet, il nous semblait impératif de confronter les méthodes et les concepts utilisés dans les sciences de l’information à ceux utilisés dans des disciplines voisines quand elles s’intéressent à l’organisation des connaissances. Il nous semblait aussi nécessaire de ne pas s’en tenir aux savoirs écrits et enregistrés et à la seule activité de repérage de l’information dans des documents textuels.

Les approches conceptuelles : rupture ou continuité ?
À l’heure où le texte intégral règne sans partage sur le Web et où les utilisateurs semblent se satisfaire des résultats trouvés par leur moteur de recherche favori, les spécialistes de l’organisation des connaissances sont en droit de se poser des questions : y a-t-il encore une place pour les outils de catégorisation, les plans de classement ou les thesaurus ?

— Le texte intégral comme modèle dominant
Les moteurs de recherche sur Internet font aujourd’hui partie du quotidien de publics de plus en plus larges et on assiste à une très grande popularisation des systèmes d’indexation et de recherche sur le texte intégral des documents dans les entreprises (systèmes d’information et intranets). Héritiers des travaux de recherche amorcés dans les années 1970 en traitement automatique des langues et en informatique documentaire, ces moteurs de recherche ont rencontré, avec l’expansion du Web, un environnement technologique très favorable à leur développement : une disponibilité croissante de documents sous forme numérique, des machines rapides, des capacités de stockage en perpétuel accroissement et des réseaux capables de transporter presque instantanément les résultats d’une requête. Le Web a donc favorisé le développement de ces moteurs et les retombées sur les systèmes d’information administratifs, culturels, éducatifs, scientifiques ou d’entreprise ne se sont pas fait attendre : du courrier commercial aux encyclopédies en passant par les romans ou les articles scientifiques, sur CD Rom ou sur une machine personnelle, tout peut aujourd’hui être géré par des logiciels de repérage dans lesquels l’option de recherche en texte intégral est devenue l’option de base.
De fait, face à l’abondance des flux d’information, l’économie de l’indexation exclusivement manuelle, fondée sur une analyse thématique intellectuelle des contenus, paraît totalement inadaptée. Complexe à mettre en œuvre et à entretenir, coûteuse en temps de travail humain qualifié, peu satisfaisante pour l’utilisateur final qui ne maîtrise pas le vocabulaire d’indexation, l’analyse intellectuelle des contenus semble avoir succombé face aux avancées triomphantes de l’indexation automatique. En est-il de même de l’organisation des connaissances ? Nous ne le pensons pas, car les besoins se sont déplacés et de nouvelles perspectives sont apparues, créant de nouveaux chantiers de construction d’outils de catégorisation.

— Outils traditionnels, nouveaux usages
Si la voie de l’indexation automatique du texte intégral s’est généralisée, elle a vite montré ses limites, limites bien connues qu’il serait trop long d’exposer ici. Les spécialistes s’accordent à dire que la recherche de « mots » ou d’« expressions » ne peut se substituer entièrement à une recherche thématique organisée, sur des ressources validées et catégorisées humainement. Les utilisateurs ne s’y trompent pas qui utilisent alternativement ou conjointement les moteurs et les schémas de classement proposés par les annuaires, répertoires, intranets ou portails de toutes natures. Les concepteurs de sites ou de produits d’information ont bien compris qu’il ne suffisait pas d’offrir un moteur de recherche pour satisfaire les usagers qui ont besoin de comprendre l’organisation des connaissances pour s’y repérer et qui souhaitent accéder efficacement à l’ensemble des informations sur un sujet. On a ainsi vu se multiplier des outils qui visent à répondre à deux types de besoins : d’une part définir et organiser les sujets et, d’autre part, indexer les contenus.
Pour définir et organiser les sujets, on ne connaît pas mieux que les taxinomies qui permettent de décrire des catégories et des sous catégories ou les classifications hiérarchiques qui mettent en évidence les relations entre des sujets généraux et des sujets plus particuliers. Souvent créées d’une manière ad hoc et dans l’ignorance des règles élémentaires de construction des classifications, elles ont servi néanmoins de révélateur et permis un renouveau de la réflexion autour de la structuration des savoirs, de l’importance de la terminologie et de la cohérence de la démarche classificatoire. Elles ont mis aussi en lumière l’importance du travail conceptuel exigé pour la création et la maintenance de ces outils quand ils concernent des gros volumes d’information tels que ceux d’une entreprise, d’un site institutionnel ou d’une bibliothèque numérique. C’est ainsi qu’on voit aujourd’hui de nombreuses structures reprendre ce travail de catégorisation en se basant sur des outils déjà existants tels que plans de classement, nomenclatures professionnelles, glossaires, vocabulaires métier, etc. D’autres ont remis en service des classifications « universelles » telles la Dewey ou la CDU pour catégoriser leurs ressources. Ce retour vers des instruments éprouvés et adaptés à ces ressources et à la structure qui les produit et les utilise assure une mise à jour moins hasardeuse et moins coûteuse et surtout une meilleure interopérabilité avec les autres composants du système d’information.
Indexer les contenus des intranets et du Web reste aujourd’hui l’apanage de structures ayant une forte tradition de gestion documentaire et traitant de domaines qui exigent fiabilité et précision. Le bruit engendré par l’indexation automatique des moteurs de recherche ne peut être accepté dans un contexte professionnel sensible. Certes les normes d’indexation existent ( Metadata Dublin Core ) et plus récemment RDF ( Ressource Description Framework )), mais le volume de documents effectivement pourvus de métadonnées reste dérisoire. En effet, décrire les documents d’une manière efficace signifie qu’on dispose d’un vocabulaire contrôlé, non ambigu, organisé de façon à expliciter les relations entre les notions. C’est la définition du thésaurus dont la première fonction est la désambiguïsation du langage. Si quelques portails notamment dans le domaine médical, scientifique ou industriel indexent leurs ressources à l’aide de leurs thesaurus respectifs, les langages d’interrogation des métadonnées exploitent insuffisamment les relations entre les notions, relations qui font tout l’intérêt de ce type d’outil.

— Les nouveaux outils du Web sémantique
Le Web sémantique est une bannière pour tous ceux qui travaillent à mettre en œuvre une nouvelle génération d’outils et de solutions pour l’organisation des connaissances, des documents et des contenus dans les environnements intranet et internet. Ce chantier est fortement soutenu par le W3C qui a publié plusieurs recommandations qui constituent aujourd’hui des standards reconnus par la communauté des chercheurs : RDF (déjà évoqué) pour la description des métadonnées et OWL ( Web Ontology Language ) pour définir des ontologies structurées. Ces deux standards sont basés sur XML.
L’objectif du Web sémantique est de fournir une caractérisation des ressources numériques qui soit interprétable par les machines. Les ontologies, qui en constituent l’élément central, sont des représentations formelles d’un domaine de la connaissance. Elles consistent en une terminologie qui sert à définir les classes d’objets à organiser, les types d’attributs qui peuvent être attachés aux objets et les types de relations qui les structurent. Des règles logiques permettent à des programmes de faire des inférences.
Les ressemblances entre un thésaurus et une ontologie sont frappantes. Dans les deux cas, il s’agit d’un vocabulaire contrôlé utilisé et validé par les acteurs d’un domaine. Dans les deux cas, ce vocabulaire est structuré et doté de relations sémantiques entre les termes qui le composent. Mais les ressemblances s’arrêtent là car la sémantique des objets et des relations dans une ontologie est une sémantique formelle qui n’est pas destinée à être interprétée par des êtres humains. Les ontologies sont bien des schémas d’organisation de connaissances construits grâce à un travail intellectuel humain, mais leur caractère formel les rend aptes à alimenter des traitements et des raisonnements menés par des automates.
Les travaux des chercheurs qui se reconnaissent sous la bannière du Web sémantique rejoignent ceux des chercheurs en intelligence artificielle qui déjà parlaient d’ontologies dans le cadre des systèmes à base de connaissances. La convergence se fait sur le terrain de la gestion de connaissances ( knowledge management ). Dans les portails d’entreprise généralement basés sur des mécanismes d’indexation en texte intégral, les ontologies sont sensées apporter une couche de « sémantisation » capable d’améliorer la pertinence des fonctions de recherche et de classification. À l’heure actuelle, les travaux aboutis sont surtout d’ordre technologique : définition de formalismes, de langages de descriptions et écriture de programmes capables de les exploiter. Le chantier de construction d’ontologies est ouvert mais il pose de sérieux problèmes dont celui du caractère prohibitif des coûts et des délais de mise au point d’une ontologie couvrant ne serait-ce qu’un champ spécifique d’un secteur industriel, médical ou scientifique. Conscients de cet enjeu économique qui conditionnera la viabilité même du projet de Web sémantique, les chercheurs tentent de réutiliser les langages documentaires existants ou de mettre à profit les technologies du traitement automatique des langues (TAL) afin d’automatiser les phases de construction des ontologies. Ces technologies d’extraction terminologique avaient déjà été largement utilisées dans l’aide à la construction de thésaurus. On en verra d’ailleurs quelques exemples dans les chapitres 2 et 4 de cet ouvrage.

— Logique et classification
Au terme de ce panorama des approches conceptuelles de l’organisation des connaissances telles qu’elles se présentent aujourd’hui, on peut s’interroger sur cette reconfiguration du champ qui met la logique formelle au centre du projet d’organisation des connaissances alors que cette place centrale avait été occupée jusque là par la philosophie des sciences et l’épistémologie.
La logique formelle peut-elle rendre compte de tous les aspects de l’organisation des connaissances ? Alain Lecomte, professeur de logique et d’épistémologie à l’université Pierre Mendès France de Grenoble, invité à ouvrir le congrès, pose la question différemment : « Y a-t-il une logique de la classification ? ». Sa contribution qui donne le ton de cet ouvrage montre comment de nombreux essais de formalisation de l’activité de classement, cas particulier de l’organisation des connaissances, ont jusqu’à présent achoppé sur le problème en apparence insoluble des restrictions et exceptions. Ni l’intelligence artificielle, ni sa version « réseaux connexionnistes » des années 1980 ne rendent objectivement et rationnellement compte des opérations de raisonnement naturel. Passant en revue la logique classique, les logiques non-monotones, la logique de l’information partielle, il en vient à dire que s’il faut trouver une logique de la classification, en tant que sous-logique de nos raisonnements naturels, alors nous sommes conduits à la fonder sur une base qui n’est pas foncièrement logique puisqu’elle concerne une division de la connaissance à un moment de l’histoire, accessible par le travail de l’épistémologue ou de l’historien des sciences et non par celui du logicien . Les problèmes de catégorisation qu’il analyse (celui de l’allaitement mercenaire en France au XVIII e siècle ou celui de la maltraitance infantile) mettent en lumière la non-naturalité des classifications. Toute catégorisation constitue une suite de décisions d’ordre moral et/ou politique qui contribue à un moment donné à valoriser un point de vue et à faire le silence sur un autre. En cela les classifications, loin d’être fondées sur la logique, sont l’expression d’un consensus établi dans des groupes dominants.

Présentation de l’ouvrage
Outre la conférence d’ouverture prononcée par Alain Lecomte, cet ouvrage est organisé en 5 chapitres qui réunissent les vingt communications présentées lors du congrès.
Le premier chapitre intitulé « Histoire », en revisite certains moments pour analyser les relations entre les conceptions successives de l’organisation des connaissances et l’évolution de la société et des usages. Roger Bautier analyse les positions respectives des doctrinaires et des saint-simoniens sur la structure à donner aux encyclopédies, simple exposé des connaissances humaines comme le conçoit Guizot auteur de l’ Encyclopédie progressive ou enchaînement des connaissances fondé sur un principe philosophique de classement tel que le réclament les saint-simoniens. Il montre que ces positions sont fortement orientées par les conceptions politiques et philosophiques de leurs auteurs. Susan Kovacs, traite de la notion d’index dans le livre imprimé au XVI e siècle. Elle étudie l’influence des programmes pédagogiques humanistes sur le développement des index, systèmes de classement des termes mais aussi outils anticipant de futurs réemplois notamment dans l’élaboration des cahiers de lieux communs.
Le second chapitre intitulé « Langue, terminologie et formalismes » présente un éventail de problématiques qui vont de l’extraction automatique de termes à la structuration des termes d’un lexique terminologique en utilisant des formalismes divers : représentations lexico-sémantiques, thesaurus, graphes et cela dans des domaines tels que la traduction, la veille scientifique ou l’intelligence économique.
On y trouve des applications du traitement automatique des langues à l’extraction de termes significatifs (Nicolas Hernandez, Brigitte Grau, Faiza Elkateb-Gara), une proposition de modèle de représentation lexico-sémantique pour dictionnaires spécialisés (Jeanne Dancette), un modèle pour thésaurus multilingue inspiré des systèmes d’information géographique (Laurent Léveillé), une utilisation de la classification automatique pour cartographier des termes extraits d’un corpus de veille (Fidélia Ibekwe-SanJuan et Eric SanJuan) et enfin un modèle de description de problèmes dans un contexte décisionnel (Philippe Kislein, Amos David et Frédérique Péguiron).
Les auteurs du troisième chapitre peuvent être étonnés de trouver leur communication sous l’intitulé « Multidimensionnalité » alors qu’ils n’utilisent peut-être pas ce terme pour caractériser leur démarche. Nous avons fait ce choix pour mettre en évidence une caractéristique commune à ces approches qui, au travers de systèmes informatiques très différents, remet à l’honneur la question de la multiplicité des points de vue. Cette nécessaire prise en compte des multiples dimensions de l’objet à décrire avait conduit les précurseurs des années 1960 à créer les thesaurus à facettes, facettes qui n’ont jamais connu en France le succès qu’ils ont eu outre-Manche. Multi-terminologie, multi-représentation et multiplicité de niveaux de description nous ont semblé renouer avec cette tradition. Ainsi le philosophe Benoît Hufschmitt pose la question d’une possible indexation des textes philosophiques, en reprenant la notion de multi-terminologie. Il suggère, pour distinguer dans tout texte philosophique ses espaces doctrinaux et dénotatifs, de les indexer à l’aide de descripteurs selon quatre facettes : dotrine-source, doctrine-objet, discipline d’usage, discipline-objet. Catherine Roussey, Djamal Benslimane, Ahmed Arara et Christelle Vangenot proposent une solution pour l’interopérabilité des ontologies qui utilise la multireprésentation des points de vue, tandis que Fabrice Pirolli et Laïd Bouzidi s’intéressent à l’organisation des connaissances et à la recherche d’information dans une logithèque.
Le quatrième chapitre qui a pour titre « Ontologies et thesaurus » pose un problème d’actualité. En effet, les ontologies, venues du monde de l’intelligence artificielle et popularisées dans le monde de l’entreprise par la vogue de la gestion des connaissances ( knowledge management ) sont apparues comme des ovni dans l’univers de la documentation. Elles sont perçues comme des outils permettant de dépasser les limites des systèmes documentaires classiques basés sur des thésaurus grâce à un enrichissement de la sémantique des relations mais leur construction pose de nombreux problèmes. Les diverses contributions, en étudiant les avantages et les limites de ces deux outils, aident à mieux comprendre ce que peuvent apporter les ontologies.
Trois des quatre interventions de cette session portent sur la construction d’ontologies à partir de corpus de textes dans trois contextes différents : l’indexation de documents audiovisuels à l’Ina (Véronique Malaisé, Pierre Zweigenbaum, Bruno Bachimont), la bibliothèque numérique de thèses en ligne à l’Insa, (Rocio Abascal, Béatrice Rumpler, Jean-Marie Pinon) et ForSIC, base de connaissance en ingénierie pédagogique (Olivier Ertzscheid, Jo Link-Pezet). La dernière intervention présentée par Michèle Hudon expose les résultats d’une étude comparative entre quatre macrothésaurus visant à faciliter l’accès à l’information administrative en ligne au Canada.
On ne pouvait pas imaginer un congrès sur l’organisation des connaissances sans consacrer une session aux bibliothèques et aux problèmes de l’accès à l’information et de l’appropriation des connaissances. C’est l’objet du cinquième chapitre intitulé « Bibliothèque et appropriation » qui étudie la relation entre les schémas d’organisation, qu’ils soient classificatoires ou hypertextuels, et les utilisateurs, qu’ils soient en situation de consultation de catalogues, de recherche d’information ou de lecture sur écran.
Ce chapitre donne l’occasion de présenter aux chercheurs et aux praticiens de la documentation les avancées réalisées en 2003 en matière d’accès thématique aux collections des bibliothèques sur le modèle des annuaires ou des portails spécialisés sur le web (Richard Roy) et de croiser cette approche avec l’utilisation de la classification Dewey pour catégoriser automatiquement les résultats obtenus lors d’une recherche dans un catalogue en ligne (Madjid Ihadjadene). Il s’intéresse aussi aux stratégies individuelles et collectives d’appropriation des résultats d’une recherche sur le Web (Olivier Ertzscheid) et au développement d’outils d’écriture (annotation ou rédaction de commentaires par exemple) pour exploiter les ressources sur le web (Thierry Soubrié).
Cette organisation en cinq parties nous semble refléter les tendance actuelles de la recherche dans le domaine de l’organisation des connaissances et nous espérons qu’elle sera de nature à faciliter l’accès aux travaux que nous présentons. Nous vous souhaitons bonne lecture et vous donnons rendez-vous en 2005 au prochain congrès d’Isko-France.
ALAIN LECOMTE
— Conférence invitée —

Y a-t-il une logique de la classification ?

Problèmes de la classification
L’activité de classification est fondamentale dans la cognition humaine et même, plus généralement, animale. Piaget a ainsi montré combien les schèmes classificatoires étaient à la source de nos opérations intellectuelles les plus élaborées, y compris de notre aptitude au raisonnement formel. Pourtant les nombreux essais de formalisation de cette activité, en termes d’une logique, ont jusqu’à présent achoppé sur des problèmes en apparence insolubles, comme les exceptions et les restrictions aux critères nécessaires à l’établissement d’une classification exhaustive.
Le mécanisme des restrictions est interne à la taxinomie. Lorsque par exemple, au XVIII e siècle, on a découvert les monotrèmes, dont le spécimen le plus caractéristique est l’ornithorynque (ou platypus), il a bien fallu leur donner une place dans la classification de Linné. Aujourd’hui, l’ Encyclopédia Universalis dit : « par leur revêtement de poils et leurs glandes mammaires, leur diaphragme et leur cœur à quatre cavités, leur articulation mandibulaire et leur oreille moyenne, leur homéothermie et quelques autres caractères, les Monotrèmes, qui vivent dans la région faunistique australienne, sont indiscutablement des Mammiferes. Cependant, ils possèdent aussi quelques dispositions primitives (squelette de la ceinture pectorale, appareil reproducteur) qui rappellent les Reptiles ancestraux. On constate, en outre, la présence de caractères très spécialisés en relation avec leurs modes de vie et leurs régimes alimentaires particuliers ».
Elle nous indique aussi à l’article « mammifères » que : « déjà, Aristote avait reconnu l’existence d’un ensemble de Vertébrés quadrupèdes, vivipares et porteurs de poils. Il faut tout de suite préciser que les Monotrèmes sont, dans ces conditions, exclus ; ils ne furent découverts

* Professeur de logique et épistémologie, Université Pierre Mendès France, Grenoble 2.
qu’au XVIII e siècle. C’est seulement dans la dixième édition (1758) du Systema naturae que Linné emploie le terme Mammalia ; les Cétacés et les Cheiroptères, qui avaient jusqu’alors été respectivement classés avec les Poissons et les Oiseaux, prennent enfin une position systématique logique. Les grands traits de la classification des Mammifères sont fondés sur l’anatomie de l’appareil génital femelle, depuis les travaux d’Henri Ducrotay de Blainville (1834) et enfin de Thomas Henry Huxley (1880). Les trois sous-classes de Mammifères actuels sont les suivantes : les Protothériens (ovipares), ou Monotrèmes (ex. l’ornithorynque) ; les Métathériens, ou Marsupiaux (exemple le kangourou), vivipares aplacentaires (avec des exceptions) ; les Euthériens ou placentaires vrais » .
Autrement dit, si les mammifères jusqu’au XVIII e siècle se sont caractérisés comme vivipares, quadrupèdes et porteurs de poils (trois critères que nous noterons A, B, C), on n’en a pas moins reconnu plus tard que des individus porteurs de B et de C mais non de A étaient néanmoins M (mammifères) et dans la dixième édition du Systema naturae de Linné que des individus ne portant ni B ni C n’en étaient pourtant pas moins M, eux aussi. Ainsi une espèce peut être décrite comme une spécialisation d’un genre alors qu’elle ne possède pas certains des attributs permettant de décrire ce dernier. Bien sûr dira-t-on, face à ce genre de contradictions, les critères vont se déplacer : « la définition des Mammifères qui semble maintenant devoir s’imposer est celle d’un taxon regroupant tous les descendants du plus récent ancêtre commun des Monotrèmes et des Thériens (Marsupiaux et Placentaires) », ce qui bien entendu suppose une connaissance approfondie de l’évolution des espèces, autrement dit d’un savoir qui n’est pas toujours accessible, et qui en tout cas, ne l’était pas au moment d’établir la classification. On peut de plus se demander si cette définition n’a pas été justement choisie de manière ad hoc pour cadrer avec les regroupements taxinomiques effectués auparavant : n’aurait-elle pas été différente si on avait choisi de classer les monotrèmes ailleurs ?
En fin de compte, on parle de restrictions chaque fois « qu’on a de bonnes raisons théoriques pour affirmer que les membres d’une classe A sont des membres d’une classe plus générale B même si les attributs des B ne se retrouventpas tous dans les A » (Crocco, 1995). Ceci perturbe nos habitudes de raisonnement logique classique car en suivant ce dernier, nous serions face à la situation suivante : (1) tout B possède les propriétés M, N, P, autrement dit tout B est un M, un N et un P tout A est un B donc tout A devrait être un M, un N et un P or, il n’en est rien !
Le problème des exceptions est semblable tout en se posant à un niveau différent : si les restrictions concernent les relations entre classes, les exceptions concernent les relations entre une classe et un élément de celle-ci. En termes ensemblistes, les restrictions concernent l’inclusion, alors que les exceptions concernent la relation d’appartenance. On peut dire aussi que la question des restrictions concerne l’approche théorique de la classification (comment définir un système d’emboîtements de concepts, autrement dit une hiérarchie, qui soit optimale) alors que celle des exceptions se rapporte à son usage empirique (une fois cette hiérarchie construite, comment m’y prendre pour y insérer tous les individus concrets qui se présentent à moi). Les restrictions conduisent à des remaniements de la hiérarchie de classification, éventuellement à une définition de critères mieux adaptés, les exceptions concernent souvent des accidents. Ainsi tel animal, parce que quadripède, devrait entrer dans telle classe, mais il se trouve que justement l’exemplaire que j’ai en ma possession n’a que trois pattes (parce qu’il est né difforme ou parce qu’il en a perdu une dans un accident), il est donc, à la lettre, une exception. Mais bien sûr, on peut découvrir un jour un individu qui est exceptionnel autrement que par accident : il posera donc lui-même un problème pour le système de classes élaboré. Mais en tout état de cause, il y a une différence de niveau entre les deux phénomènes, celui de la restriction et celui de l’exception. Une logique de la classification doit en tenir compte et doit formaliser non seulement un état défini d’un système classificatoire, mais aussi la dynamique de ce système , autrement dit son aptitude plus ou moins grande à évoluer sous la pression d’un ajout de classe ou de l’admission d’exceptions sans que les attributs éventuellement niés lors de ces ajouts puissent être toujours connus a priori.

Les logiques non monotones
De nombreuses tentatives ont existé afin de décrire le genre de raisonnement mis en œuvre dans l’activité classificatoire. Il faut noter l’importance du problème : tout échec dans sa résolution aurait une portée théorique et philosophique de poids, puisqu’il signifierait l’inaptitude de la logique à rendre compte de la base même de notre activité cognitive, et donc a fortiori du raisonnement naturel.
Si nous abordons naïvement le problème soulevé en (1), nous observons que nous pourrions sans doute diminuer son acuité si nous le formulions comme en (2) :

5 — tout B possède en principe (ou normalement ) les propriétés M, N, P, autrement dit tout B est normalement un M, un N et un P
6 — tout A est un B, (on a de bonnes raisons de le croire)
7 — donc tout A devrait être normalement un M, un N et un P
8 — or, il n’en est rien... donc : A est un B qui n’est pas tout à fait normal !
Et alors évidemment nous n’avons pas de contradiction. Ce faisant nous avons utilisé un concept qui s’éloigne de la logique : nous ne parlons plus d’implication (d’une propriété par une autre) mais d’implication en principe , ou d’implication dans certaines conditions normales, ce qui suppose que par moment, lesdites conditions ne sont pas réunies, ou bien un principe est violé. L’Intelligence Artificielle a beaucoup thématisé ce genre de problème, elle a notamment développé dès les années soixante, des séries d’exemples devenus depuis de véritables « tartes à la crème » comme : En principe, les oiseaux volent. Les pingouins sont des oiseaux. Tweety est un pingouin et pourtant... Tweety ne vole pas !
En effet : les pingouins sont des oiseaux qui connaissent la restriction de ne pas voler. On peut représenter le raisonnement classique de la façon suivante :
Prémisses : ∀x O(x) ⇒ V(x) ∀x P(x) ⇒ O(x) ∀x P(x) ⇒ ¬V(x) P(Tweety)
Raisonnement :

Particularisation de (b): P(Tweety) ⇒ O(Tweety)
Modus Ponens : O(Tweety)
Particularisation de (a): O(Tweety) ⇒ V(Tweety)
Modus Ponens: V(Tweety),
Particularisation de (c) : P(Tweety) ⇒ ¬V(Tweety)
Introduction de la conjonction : V(Tweety)∧ ¬V(Tweety) : contradiction
Et le raisonnement « classificatoire » :
Prémisses : (où « ⇒* » devrait se lire : « implique normalement ») ∀x O(x) ⇒* V(x) ∀x P(x) ⇒ O(x) ∀x P(x) ⇒ ¬V(x) P(Tweety)
Raisonnement :

Particularisation de (b) : P(Tweety) ⇒ O(Tweety)
Modus Ponens : O(Tweety)
Particularisation de (a): O(Tweety) ⇒* V(Tweety)
Modus Ponens : V(Tweety) « en principe »,
Particularisation de (c): P(Tweety) ⇒ ¬V(Tweety)
On a cette fois : V(Tweety) « en principe » et ¬V(Tweety)
Conséquence : ¬V(Tweety) (puisque explicitement la prémisse (c) stipule que nous ne sommes pas dans les conditions normales d’application de (a)).
On doit noter alors que si nous savons d’un individu (Tweety) qu’il est simplement un oiseau, alors d’après (a), nous concluons que normalement il vole, mais si nous savons qu’il est un pingouin (ce qui est plus spécifique que d’être un oiseau), alors nous ne pouvons plus déduire qu’il vole : autrement dit l’ajout d’information nous oblige à rétracter notre précédente conclusion. Cela est en opposition avec le comportement classique : si je sais que Paul est médecin, j’en déduis qu’il a effectué au moins six années d’études, si je sais qu’il est pédiatre, une spécialité de la médecine, je peux toujours effectuer la même déduction. Le raisonnement classique est dit « monotone » : la classe des conséquences d’un ensemble de prémisses croît de façon monotone avec la classe des prémisses. Le raisonnement classificatoire est dit, lui, non monotone . Depuis environ une cinquantaine d’années, les spécialistes d’Intelligence Artificielle essaient de donner un statut théorique indiscutable à cette notion de non monotonie. Cela ne va pas sans mal. Est-ce que la monotonie n’est pas justement incluse dans la définition même de la logique (science des inférences, art de passer du vrai au vrai en toute circonstance) ? En ce cas, l’expression de logtque non monotone apparaîtrait comme un oxymoron (point de vue soutenu par exemple par le logicien David Israël dans les années soixante-dix). Problème plus grave, parce que se traduisant dans de réelles questions d’étude des propriétés d’une telle logique : si nous définissons comme Cons(T) l’ensemble des conséquences d’une théorie T (exprimée comme la conjonction d’un nombre fini d’axiomes), dans une logique monotone, Cons(T) est le point fixe d’un opérateur de déduction (si « -> » est l’opération de déduire une conséquence à partir d’un ensemble de propositions, on peut définir des ensembles Cons i (T) qui contiennent toutes les conséquences obtenues en appliquant i fois cette opération, on atteint un point fixe quand on arrive à une valeur de n telle que Cons n (T) = Cons n+1 (T)). Dans le cadre d’une logique non monotone, l’opérateur en question ne possède pas de point fixe unique ! Autrement dit, on a le choix quant à l’ensemble de conséquences possibles d’une théorie. Cela vient tout simplement du fait que les conséquences possibles dipendent de l’ordre dans lequel on prend en compte les prémisses.
Un exemple bien connu est le suivant : Les républicains sont non pacifistes, Les quakers sont pacifistes Nixon était un quaker républicain
Que pouvons-nous conclure ? Si nous examinons les prémisses dans cet ordre, nous concluons : Nixon était non pacifiste, et donc un quaker non typique, mais dans un autre ordre : Nixon était pacifiste, et donc un républicain « anormal ». Bien sûr, les deux conséquences sont contradictoires entre elles : de façon générale, l’union des points fixes, quand il s’agit d’ensembles distincts, donne un ensemble incohérent de propositions. Certains auteurs ont alors proposé de ne garder comme conséquences que celles qui sont communes à tous les points fixes, mais alors on reste souvent sur sa faim... pourquoi utiliser un cadre logique non monotone pour finalement ne tirer que les conclusions qu’on pourrait déduire dans un système monotone où certaines prémisses seraient supprimées (dans l’exemple précédent, s’il s’agit de dire qu’on ne peut rien déduire, alors on peut arriver au même résultat en ne prenant tout simplement pas en compte les deux prémisses 1). Une solution possible consiste bien sûr à supposer que les prémisses, dans un problème de ce genre, sont toujours ordonnées selon certaines préférences . Mais alors il faut admettre que le raisonnement n’est pas « entièrement logique » Puisque sous-tendu par l’expression préalable d’un choix: nous verrons plus loin que c’est justement là que peut s’insérer la part de décision non purement rationnelle de l’activité de classification.

Une autre conception du raisonnement classificatoire : celle de Jean-Yves Girard
J.-Y Girard, le « découvreur » de la logique linéaire, a tenté de résoudre d’une autre manière les problèmes d’exceptions et de restrictions. Considérons à nouveau le problème de la taxinomie des mammifères sous sa forme simplifiée qui partirait d’une caractérisation des mammifères comme quadrupèdes, vivipares et porteurs de poils, et de l’inclusion dans cet ordre des monotrèmes qui ne sont pas vivipares mais ovipares. M implique Q, V et P, mais m hérite de tous les attributs de M sauf V et possède de plus l’attribut O (ovipare), autrement dit m implique M et O mais pas V . Girard propose d’écrire ces axiomes sous la forme :

M —o (1 & Q) ⊗ (1 & V) ⊗ (1 & P)
m —o (1 & M) ⊗ (1 & O) ⊗ (V —o 1)
où les symboles -o, ⊗ et & sont des connecteurs de la logique linéaire. —o est une implication qui « eonsomme » sa prémisse (autrement dit elle n’est pas utilisable une deuxième fois), ⊗ est la conjonction multiplicative (autrement dit « cumulative », de A ⊗ B, on ne peut déduire ni A tout seul, ni B tout seul, de la même manière que du fait qu’un drapeau soit rouge et blanc on ne saurait déduire ni qu’il est rouge, ni qu’il est blanc) et & est la conjonction additive, qui s’interprète comme un choix (A & B : vous avez le choix entre A et B, par exemple à la fin d’un repas vous avez le choix entre fromage ou dessert, ce qui signifie que vous avez potentiellement aussi bien l’un que l’autre, mais pas les deux à la fois, de A & B on peut déduire A, comme on peut déduire B), 1 est l’élément neutre de ⊗, autrement dit c’est... rien ! Comme dans cette logique, toutes les formules et sous-formules sont interprétées comme des ressources, avoir (V —o 1) est comme avoir une sorte de gomme à effacer V : si vous avez V et (V —o 1), alors vous pouvez déduire 1, et il ne reste plus rien ! On peut alors déduire : m —o O, m —o Q et m —o P : d’abord de (1 & M) on peut déduire M et donc on a :

m —o (1 & Q) ⊗ (1 & V) ⊗ (1 & P) ⊗ (1 & O) ⊗ (V —o 1) de (1 & V) on peut déduire V, d’où :
m —o (1 & Q) ⊗ (1 & P) ⊗ (1 & O) ⊗V⊗(V —o 1)
d’où :

m —o (1 & Q) ⊗ (1 & P) ⊗ (1 & O) ⊗ 1
d’où :

m —o (1 & Q) ⊗ (1 & P) ⊗ (1 & O)
d’où on peut déduire aussi bien :

m —o 1 ⊗ P ⊗ 1, c’est-à-dire m -oP
que :

m —o Q ⊗ 1 ⊗ 1 c’est-à-dire m —oQ
et que :

m —o 1 ⊗ 1 ⊗ O, c’est-à-dire m —oO
Si nous introduisons l’exponentielle « ! » qui est comme une modalité, avec l’interprétation que « !A » signifie que la ressource A peut être utilisée autant de fois qu’on le désire, alors nous pouvons tout aussi bien démontrer (la possibilité de réutiliser m ne change rien à la démonstration) : !m —oO, !m —oQ et !m -oP, qui sont respectivement équivalentes aux implications classiquesm⇒O, m⇒Qetm⇒P Autrement dit, il n’y a pas de doute : un monotrème est un ovipare quadrupède porteur de poils, le raisonnement taxonomique a rejoint le raisonnement classique. En revanche, est-il possible désormais de déduire quem⇒V?
Cela reviendrait à prouver !m — o V D’une façon générale, si nous voulons démontrer m — o F, où F est un atome quelconque, compte tenu de l’axiome ci-dessus au sujet de m, il faudra effacer V —o1, mais cela ne peut être fait qu’avec un V, mais en ce cas, V disparaît aussi comme ressource et F ne peut jamais être V ! Si maintenant nous voulons prouver !m —oV, alors m devra pouvoir être répété autant de fois qu’on veut, mais s’il apparaît deux fois dans la déduction, il fera apparaître deux instructions d’effacement V —o 1 et 0, 1 ou 2 fois V, dans tous les cas, il ne restera jamais un seul V à l’arrivée !
Autrement dit Girard résout le problème en changeant le sens de la négation: ne pas posséder un attribut ne signifie pas qu’on possède la négation de cet attribut, mais seulement qu’on l’ignore. Ainsi raisonner sur les groupes non commutatifs n’est pas travailler sur des groupes qui sont explicitement non commutatifs mais sur des groupes où on ne fait pas l’hypothèse de commutativité (et donc cette propriété est ignorée).
Cette approche est astucieuse car elle évite les contradictions de (1). Mais est-elle utile ? C’est une approche globale qui suppose le problème de la classification résolue. Si nous avons décidé une fois pour toutes de ranger les monotrèmes parmi les mammifères, alors afin d’éviter les contradictions logiques qui risquent d’en résulter, nous n’avons qu’à traduire la restriction comme un effacement de propriété, mais cela ne participe en aucune mesure de la formalisation du processus de classification. En particulier, cela ne nous guide pas vers un chemin optimal.

Une voie « épistémologique »
Devons-nous dire toutefois, comme l’affirment les tenants du raisonnement non — monotone, (McDermott, Reiter, McCarthy...) que la non-monotonie est le trait fondamental qui caractérise le raisonnement humain, dit « naturel » (ou commmonsense reasoning ) ? Ou bien ne devons-nous pas considérer ce trait comme secondaire par rapport à d’autres, plus fondamentaux, qui nous permettraient d’envisager la question du raisonnement de sens commun d’une manière nouvelle ? C’est ce que pense A. Naït Abdallah [Naït-Abdallah, 1995). De fait, toutes les informations d’un ensemble donné ne sont pas rétractables de la même manière. En astronomie à une époque donnée, nous pouvons avoir un certain nombre de connaissances, incluant la dynamique de Newton, les lois de la gravitation, le calcul différentiel et intégral mais aussi une idée du nombre de planètes. Supposons que nous pensions que le nombre de planètes est sept, alors observer au bout du télescope une huitième planète, voire une neuvième, va remettre en cause cette idée assez facilement. En revanche, les connaissances comme la dynamique de Newton ou les lois de la gravitation seront beaucoup plus difficiles à remettre en cause (même s’il peut quand même arriver qu’elles le soient, comme dans le cas des observations sur la vitesse de la lumière). C’est l’épistémologue Imre Lakatos qui est à la base de cette distinction au sein de la connaissance scientifique entre deux sortes de connaissances, qu’il a appelées connaissance-noyau (correspondant à cette partie de la connaissance à laquelle nous sommes le plus attachés et que nous n’abandonnerons qu’en désespoir de cause), ou « connaissance dure », et ceinture pratectrice, ou « connaissance molle » ( soft knowledge ) . Si, comme le fait Naït Abdallah, on suit l’idée de Quine selon laquelle « la science ne se substitue pas au sens commun, mais au contraire en propose une extension », alors cette différence s’applique aussi bien au raisonnement commun. Nous aurions alors des énoncés noyaux, formalisables par d’authentiques propositions logiques, mais aussi des énoncés périphériques, traduisant seulement des informations partielles sur le monde (que Naït Abdallah appelle des Ions d’Information Partielle ) . Pour un agent rationnel, sa connaissance à un moment donné s’exprime par un ensemble Φ d’assertions qui se répartissent entre les deux types d’énoncés.
Cet ensemble est satisfaisable par un ou plusieurs modèles partiels formant un ensemble C. Par exemple, l’énoncé Tweety est un oiseau permet d’isoler une classe de modèles C 0 qui ont en commun de rendre cette proposition vraie : c’est supposé être un fait dur, représentable par une authentique proposition. L’énoncé Tweety vole jusqu’à preuve du contraire est un élément qui n’a pas la même valeur de connaissance, c’est une sorte de connaissance « bouche-trou » ( a gap-filling statement ), qui sera représentée par un ion d’information partielle. Si nous l’ajoutons à notre précédente théorie du monde, alors nous faisons éclater C 0 en deux classes de modèles partiels : - une sous-classe C 1 où Tweety est un oiseau, où il n’y a pas d’information particulière qui soit contraire au fait qu’il vole, et où il vole, - une sous-classe C 2 où Tweety est un oiseau, et où il ne peut pas voler (parce que c’est un pingouin par exemple).
Ainsi l’ajout de nouvelles informations ne nous fait pas à proprement parler rétracter certaines conclusions, il nous fait plutôt construire. une classe de modèles partiels de plus en plus fins. Les connaissances bouche-trou ne sont là que pour remplir provisoirement notre absence de connaissance. À un moment donné, l’agent rationnel essaie de tirer le meilleur parti des connaissances qu’il possède, autrement dit il tente de minimiser l’effort consistant à imaginer des faits contraires à ce qui est considéré comme normal dans l’ensemble de ses connaissances périphériques. On peut représenter le processus de connaissance comme une dynamique : il a à passer au travers d’un certains nombre d’états, mais sa trajectoire n’est connue qu’en certains points, entre lesquels il va au plus direct, se conformant en cela à une sorte de principe implicite d’économie d’effort . C’est ainsi que Naït Abdallah explique le raisonnement à propos du fameux Yale Shooting Problem. Ce problème, autre « tarte à la crème » de la littérature en LA, consiste en ceci :

Quand une action a eu lieu, les choses restent normalement dans l’état où cette action les a mises. Après avoir chargé un fusil, celui-ci est chargé. Quand on tire sur un individu avec un fusil chargé, cet individu meurt. Après avoir chargé un fusil, attendu et tiré sur Fred avec ce fusil, Fred peut-il être encore en vie ?
Ici, tout repose bien sûr sur l’assertion « les choses restent normalement dans l’état où l’action les a mises ». Des formalisations en logique non monotone de ce problème conduisent à des extensions contradictoires : il y a celles où Fred est évidemment mort et celles où il ne l’est pas (car si on attend trop longtemps, le fusil va peut-être s’enrayer, ou bien quelqu’un sera passé entre temps qui aura déchargé le fusil etc.), et rien ne permet de préférer les unes aux autres. Dans la conception dynamique, pourtant, une extension est préférée, celle où Fred est mort, simplement parce que c’est celle qui obéit à ce principe d’économie. Les assertions du problème peuvent se répartir selon la distinction entre noyau et ceinture protectrice : appartiennent au noyau les affirmations selon lesquelles « après avoir chargé un fusil, celui-ci est chargé. Quand on lire sur un individu avec un fusil chargé, cet individu meurt », mais appartient à la connaissance périphérique l’affirmation selon laquelle « quand une action a eu lieu, les choses restent normalement dans l’état où cette action les a mises » . Cela se traduit par : les choses restent dans l’état où l’action les a mises tant qu’on peut justifier qu’elles sont effectivement dans cet état . Si nous apprenons que quelqu’un est passé et a déchargé le fusil, bien sûr cette hypothèse ne sera plus justifiée, mais à défaut de cette modification de la ceinture protectrice, le modèle partiel minimal, donc préféré, est celui où Fred est mort.
On peut bien sûr aussi envisager les problèmes de classification sous cet angle : tel animal (une baleine) est un poisson jusqu’à ce qu’un nouvel élément d’information nous persuade du contraire. Alors le système logique de Naït-Abdallah (que nous ne pouvons ici développer pour des raisons de place et de temps) s’applique. Il suppose néanmoins que nous ayons une idée a priori assez solide de la distinction entre les deux sortes de connaissance, or si cela est envisageable dans le cas de sciences dures bien établies (si on s’en tient en tout cas à la conception lakatossienne des programmes de recherche ), cela est beaucoup plus problématique dans les sciences humaines et dans le raisonnement quotidien qui ne connaissent pas toujours (voire pas du tout) de programme de recherche défini ! On notera que bien souvent, il est impossible de prévoir à l’avance ni ce que peuvent être des éléments susceptibles de nous faire changer d’avis, ni quelles sont celles de nos croyances qui s’avéreront être par la suite les plus sujettes à révision. Devons-nous alors tout ranger dans la connaissance molle ? Nous risquerions alors d’être renvoyés aux inconvénients de la logique non monotone (c’est-à-dire la grande dépendance du résultat — les conclusions tirées — par rapport à l’ordre dans lequel nous traitons nos connaissances), et à une certaine situation de chaos. Ce point va faire l’objet de développements dans ce qui suit. Notons dès à présent, pour résumer l’état de la discussion, que s’il faut trouver une logique de la classification, en tant que sous-logique de nos raisonnements naturels, alors nous sommes conduits à la fonder sur une base qui n’est pas foncièrement logique puisqu’elle concerne une division de la cannaissance à un moment de l’histoire, accessible par le travail de l’épistémalogue ou de l’bistorien des sciences et non par celui du logicien. Comme le disait déjà David Israël dans sa critique de la logique non monotone : « les chercheurs en Intelligence Artificielle intéressés par les problèmes épistémologiques ne devraient regarder ni du côté de la sémantique formelle ni de celui de la théorie de la démonstration ; mais plutôt du côté de la philosophie des sciences et de l’épistémologie ».

Les problèmes en sciences humaines et dans le raisonnement quotidien
Comme le rappelle Pierre Livet [Livet, 1996, p. 377], « la classification est un mode de catégorisation parmi d’autres ». C’est le mode de classification où les objets traités sont soumis à un opérateur particulier qui les applique sur l’ensemble {0, 1}, autrement dit l’opérateur qui sert à établir la classification est l’appartenance ensembliste ∈, qui, comme on sait, dérive du ∈, qui lui-même symbolise la copule ( est, is, ist, jest... ) . C’est dire qu’à la base de l’opération de classification, il y a toujours manipulation d’énoncés en « être, de la forme « A est/n’est pas B » (identification) ou bien « A est/n’est pas b » (inclusion) (où les lettres majuscules désignent des particuliers et les minuscules des généraux). De « A est b » nous pouvons déduire un rangement de A parmi les b, rangement qui, selon les remarques des paragraphes précédents, pourra être remis en question si les justifications apportées à cet énoncé sont rejetées. On aimerait évidemment être dans la situation idéale visée par Lakatos où certains de ces énoncés appartiennent au noyau et d’autres font seulement partie de la « ceinture de protection ». Mais que faire si les énoncés fondamentaux eux-mêmes sont immédiatement sujets à contestation ? En principe cette situation est bannie tant qu’on œuvre à l’intérieur d’un programme de recherche encore actif. Elle peut donc se rencontrer soit parce que des programmes de recherches rivaux s’affrontent, soit parce qu’il n’y a tout simplement pas de programme de recherche. Lakatos soupçonnait ainsi la sociologie moderne d’être dans ce dernier cas (aucun programme de recherche cohérent n’y serait émergent) 2 .

La catégorisation de l’allaitement mercenaire comme infanticide/ non infanticide
Nous avons autrefois [Lecomte, 1985] étudié un corpus de textes d’historien (ne)s portant sur une problématique unique, celle de « l’allaitement mercenaire en France au XVIII e siècle ». L’un des textes était d’Emmanuel Le Roy-Ladurie (in Communications n°31) et l’autre d’Yvonne Kniebiehler et Catherine Fouquet (in L’histoire des mères, 1977). Ces deux textes étaient intéressants à mettre en opposition puisque dans le premier on y lisait ouvertement que « Objectivement, l’allaitement mercenaire, en France, au XVIIIe siècle, c’était de l’infanticide » alors que le second tendait à démontrer qu’au contraire « l’allaitement mercenaire en France au XVIII e siècle avait marqué le recul de l’infanticide ». Nous sommes donc ici en présence de deux énoncés : « A est b » et « A est non b », qui sont contemporains (ces deux textes avaient été écrits à peu près en même temps) et qui viennent en conclusion chacun d’une série d’arguments qui utilisent sensiblement les mêmes sources ! On peut bien sûr se demander comment cela est possible. Si nous regardons de près l’argumentation, nous voyons que, chez Le Roy-Ladurie, sont avancés à l’appui de la thèse des faits en apparence objectifs : la pratique de mise en nourrice à la campagne s’est accompagnée d’énormes pertes, les enfants parfois tombaient de la charrette qui les emmenait à la ferme, ils étaient maltraités, les nourrices en élevaient plusieurs dizaines et n’y voyaient qu’une source de revenu, à la ferme les bébés étaient laissés à l’abandon, parfois picorés par les dindons et même dévorés par les cochons. Les femmes des villes étaient ainsi soupçonnées de se débarrasser à bon compte d’enfants en surnombre qui les auraient empêché de vivre la vie qu’elles souhaitaient. Au lieu de cela, les historiennes Yvonne Kniebiehler et Catherine Fouquet insistent sur le fait que cette pratique explose en importance au XVIII e siècle, à une époque où les mœurs deviennent moins rudes et où les mères ne peuvent plus se résoudre à l’infanticide direct et réel qui était encore pratiqué aux siècles précédents. Les femmes des villes ont certes des activités qui les pousseraient à mettre les enfants de côté, car disent-elles « comment pourraient-elles continuer à aider le mari à la boutique ou à la fabrique, un marmot accroché à leur mamelle ? », mais elles veulent préserver la vie de leurs nourrissons en les plaçant auprès de nourrices campagnardes. Qu’est-ce à dire ici de ces raisonnements ? Allons-nous dire que « l’allaitement mercenaire est normalement un infanticide (puisqu’il conduit objectivement à la mort d’un très grand nombre d’enfants), sauf preuve du contraire, à savoir quand l’intention des mères est toute autre et qu’elles veulent les préserver de l’infanticide » ? ou bien allons-nous dire que « l’allaitement mercenaire n’est bien sûr pas normalement un infanticide (puisqu’en allaitant, en principe on ne tue pas), sauf preuve du contraire, à savoir quand il s’effectue dans des conditions telles qu’il conduit à la mort de nombreux enfants » ? Dit brièvement : lequel des deux énoncés « l’allaitement mercenaire est un infanticide » et « l’allaitement mercenaire marque le recul de l’infanticide » appartient à une connaissance noyau ? Il semble en ce cas très difficile de répondre, la méthode induite par la logique de l’information partielle est-elle applicable ? Ne conduit-elle pas à une solution chaotique, d’où il ne pourrait pas s’extraire de trajectoire dynamique optimale, comme si on devait rester à l’intérieur d’un oscillateur perpétuel ? Avec cet exemple, nous touchons en réalité à un point crucial de l’activité classificatoire : son caractère subjectif. Dans les travaux antérieurs cités, nous avons à ce propos mis en lumière les stratégies discursives fondamentales sur lesquelles se basaient les deux discours. Le texte de « L’histoire des mères » faisait intervenir le style indirect libre, autrement dit ce style où « le support de l’énonciation rapportée n’est identifié que par le contexte, à l’exclusion des procédés proprement linguistiques » [Danon-Boileau, 1982, p. 54] (« De quelle aide peut-elle être à la boutique ou à l’atelier, avec un marmot pendu à la mamelle ? De quel divertissement lorsqu’elle est tout occupée à nourrir ? De quelle compagnie quand il ne faut l’approcher de peur de gâter son lait ? » ). Dans le style indirect libre, souvent utilisé en littérature, les propos rapportés ne sont pas signalés par des guillemets, comme dans le cas du style direct : on rapporte une scène, mais elle n’est pas totalement représentée, elle est comme « mimée par le narrateur primaire au sein de son discours propre » (Danon-Boileau, ibid.), et s’il en est ainsi, c’est souvent « parce qu’elle sert d’argument démonstratif à l’appui d’une thèse. » Ainsi, dans ce cas présent, les deux historiennes concluent dans le sens de « A est non-b » en épousant le point de vue d’un sujet qui n’est pas elles (qui fonctionnent en tant que narratrices primaires) mais les femmes du XVIII e siècle, dont le discours est rapporté, alors que l’historien Le Roy Ladurie, quant à lui, met entre ces narratrices rapportées et lui toute la distance permise par l’utilisation du style direct. On ne saurait mieux dire que le point de vue de sujet possède un rôle déterminant dans l’acte de catégorisation.

Le cas de la maltraitance infantile, analysé par Ian Hacking
Dans l’exemple de l’allaitement mercenaire, nous avions à décider de l’inclusion d’une catégorie (« allaitement mercenaire ») dans une autre (« infanticide »). Le terme de droite était supposé acquis et c’est le terme de gauche dont on interrogeait le statut. Le cas réciproque peut se produire aussi, celui où l’on part d’une catégorie englobante pour se demander ce qu’elle est en droit d’englober. L’épistémologue lan Hacking a étudié de manière approfondie [Hacking, 2001] la manière dont la maltraitance infantile a émergé, dans les quarante dernières années, en tant que « manière de décrire et de classifier des actes et un comportement ». Il note d’abord que cette catégorie est venue à l’existence en un moment et un lieu précis : dans des discussions et des observations qui ont eu lieu à Denver, Colorado, en 1960, et qui ont été publiées par l ‘ American Medical Association, en 1961. Les pédiatres de Denver attirèrent l’attention sur des blessures répétées dont souffraient de jeunes enfants, qu’ils rapportèrent à un nouveau syndrome, le syndrome de l ’ enfant battu. Dès 1965, l’ Index Medicus ajoute la maltraitance infantile à sa liste de catégories médicales à cataloguer, puis la presse s’empare du sujet et commence à se répandre l’idée de la « transmission héréditaire » de la maltraitance, idée selon laquelle les parents reproduisent sur leurs propres enfants les comportements qu’ils ont eux-mêmes subis (sans qu’il n’y ait jamais eu, selon Hacking, de statistiques élaborées sur ce sujet). La maltraitance infantile devient alors un concept fourre-tout où se mêlent aussi bien des cas de maltraitance authentique et des cas de négligence. À partir de 1971, il apparut que la maltraitance physique était souvent associée aux violences sexuelles. Les violences sexuelles entre frères et soeurs en vinrent à y être intégrées dans les années 1975-80. On voit alors apparaître un discours moralisateur : « les faits suggèrent que la violence parmi les enfants, en particulier entre frères et sœurs, est très fréquente et sans doute en voie d’augmentation au fur et à mesure que des parents seuls qui travaillent sont obligés de laisser de petits enfants aux soins des plus âgés » [Wissow, 1995, cité par Hacking, p. 191]. On peut noter incidemment que déjà ce genre de discours apparaissait sous la plume de certains analystes de l’allaitement mercenaire au XVIII e siècle, ( cf., « que l’épouse du petit juge, qui n’a pas de salon à tenir et dont les tâches ménagères sont assez réduites, éprouve le besoin de confier son enfant à une nourrice, voilà qui reste assez difficilement compréhensible », Le Roy Ladurie). Dans l’évaluation de la maltraitance infantile, les sévices sexuels deviennent alors prévalents, au point que l’expression en usage aux États-Unis est celle de child abuse, qui connote l’abus sexuel. Il est remarquable d’autre part que la maltraitance infantile ait été elle-même cataloguée immédiatement comme fait médical plutôt que social. Pour cela, on a insisté sur le fait que cela concernait tous les milieux. Hacking note : « en raison du climat d’opinion individualiste particulier aux États-Unis, une part essentielle du programme politique américain vise à séparer le problème des enfants meurtris de tout autre enjeu social ». « Il s’agit là d’un problème politique et non d’un problème de pauvreté », martelait le sénateur Mondale. L’accent mis sur.les aspects sexuels contribue alors à faire du phénomène une question liée à des attitudes perverses médicalisables, qu’on peut détacher de toutes considérations d’inégalités sociales. Ce point est tellement fort que lorsque des pédiatres indiens, souhaitant attirer l’attention sur le drame des millions d’enfants affamés du sous-continent et songeant à tirer partie du fort mouvement contre la maltraitance infantile, lancent le thème de « l’enfant nutritionnellement maltraité », ils sont tout bonnement éconduits et leur proposition d’inclure la sous-alimentation dans la maltraitance est abandonnée. « Cette métaphore — commente Ian Hacking - n’a pas été nourrie par les passions profondes de l’innocence, de l’inceste et de l’effondrement de la famille nucléaire ; il ne s’agissait que de quelques millions d’enfants affamés sans importance ».
Cet exemple à son tour nous renseigne sur ce qui est souvent en jeu dans la classification, à savoir une suite de décisions d’ordre moral et/ou politique qui contribue à un moment donné à enrégimenter une suite d’observations légitimes au sein d’une catégorie aux contours mal définis mais émergeant d’un consensus établi dans des groupes dominants. Il n’est évidemment plus question alors d’une quelconque logique, sauf à se situer à un méta-niveau qui tenterait d’analyser les stratégies globales des groupes en question.

Conclusion
Cette contribution a voulu relier entre eux des thèmes rarement traités ensemble : des thèmes de logique et d’Intelligence Artificielle et des thèmes de réflexion épistémologique et sociopolitique. Il était nécessaire de se plonger un instant dans les premiers afin de voir de l’intérieur les limites mêmes de l’entreprise consistant à donner une base objective et rationnelle à la taxonomie. L’Intelligence Artificielle n’est en réalité jamais parvenue pour l’instant à donner une vision cohérente et conforme à son projet des opérations de raisonnement naturel. Dans les années 1980, elle s’est vue substituer une nouvelle version, se voulant plus proche du fonctionnement supposé du cerveau, consistant dans les réseaux connexionnistes. Cette version reprenait en fait, mais sous un jour nouveau, les mêmes principes que l’IA classique : les neurones formels remplaçaient les portes « et/ou », mais représentaient une simplification similaire par rapport aux neurones réels. On concevait la catégorisation d’objets comme reposant d’abord sur une phase d’apprentissage, au cours de laquelle se réglaient les poids des neurones formels, puis sur une phase d’enregistrement au cours de laquelle le réseau « reconnaissait » une forme. Bien entendu, on n’expliquait pas comment, au préalable, on avait catégorisé les inputs. Nous avons vu d’autre part que, dans le cas de disciplines scientifiques où peut s’appliquer pleinement la conception des programmes de recherche de Lakatos, la logique de l’information partielle peut parvenir à nous donner une image assez satisfaisante des opérations que nous effectuons lorsque nous avons à intégrer des informations nouvelles au sein de connaissances dont certaines sont vues comme des connaissances-noyau et d’autres comme de simples connaissances périphériques, qui sont là, en quelque sorte pour protéger les premières (d’où leur nom de « ceinture de protection »). Mais la question qui apparaît alors est celle de savoir s’il est bien raisonnable d’admettre, à la façon de Quine, une continuité de principe entre connaissance commune et connaissance scientifique. Si cela était le cas, la distinction ci-dessus entre deux types de connaissances pourrait toujours s’effectuer de manière relativement aisée. Or, nous avons vu dans les deux derniers exemples que cela était loin d’être le cas. Ou alors, si nous y tenons, il faudra ne plus dire que les connaissances noyau sont celles « auxquelles nous tenons le plus », mais celles auxquelles certains groupes dominants, à un moment donné, tiennent le plus... Ceci serait de nature en effet à « expliquer » pourquoi la suggestion des pédiatres indiens d’inclure la sous-alimentation des enfants dans la catégorie de maltraitance infantile est rejetée, en tant que menaçante pour un bloc d’énoncés-noyaux dont le libéralisme conservateur américain tient à garder la maîtrise.

Bibliographie
CROCCO Gabriella, (1995), « Approches logiques du raisonnement taxinomique », in Dubucs, J., Lepage, F. (Eds.), Méthodes logiques pour les sciences cognitives, pp. 165-193, Hermès, Paris.
DANON-BOILEAU Laurent, (1982), Produire le fictif Klincksieck, Paris.
GIRARD Jean-Yves, (1992), « Logic and exceptions, a few remarks », Journal of Logic and Commutation, vol. 2, n°2, Oxford University Press.
HACKING lan, (2001), Entre science et réalité, la construction sociale de quoi ? traduit de l’anglais par Benoît jurdant, La Découverte, Paris.
ISRAËL David, (1980), « What’s wrong with non-monotonie logic? », in Proc. First AAA1 Corrference, pp. 99-101, Morgan Kaufmann.
KNIBIEULER Yvonne, FOUQUET Catherine, (1977), Histoire des mères , Le Livre de Poche, coll. Pluriel, Paris.
LECOMTE Alain, (1985), Des raisons sous lea mots , rapport technique de fin de contrat dans le cadre du Programme, « Science, Technologie, Société » du CNRS.
LE RoY-LADURIE Emmanuel, (1979), « L’allaitement mercenaire au XVIII e siècle », Communications, n°31, Le Seuil, Paris.
LIVET Pierre, (1996), « Catégorisation et connexionnisme », in Rialle, V. et Fisette, D. (Eds.), Penser l ’ esprit , des sciences de la cognition à une philosophie cognitive, pp. 375-392, PUG, Grenoble.
NAÏT-ABDALLAH Areski, (1995), The Logic of Partial Information, Springer, Encyclopedia Universalis , articles « classification » et « mammifères ».
Chapitre 1
Histoire
SUSAN KOVACS 3
Penser, classer, et la culture de l’imprimé,
L’index du livre imprimé au XVI e siècle

Résumé :
Sous l’influence des programmes pédagogiques humanistes et notamment la généralisation de la pratique des lieux communs, les éditions d’ouvrages de philosophie morale du XVI e siècle se verront dotées d’index volumineux permettant au lecteur d’effectuer des recherches ciblées selon des points d’accès multiples. Si la culture de l’imprimé contribue ainsi à définir le texte comme une ressource informationnelle à exploiter, la nature des index révèle une ambiguïté fondamentale. L’index, conçu à la fois comme un système de classement de termes et un système de classification de valeurs, sert de garant de l’exemplarité philologique et morale de l’ouvrage tout en anticipant ses futurs réemplois et recontextualisations.
Mots-clés :
index, lieu commun, livre imprimé, Plutarque, Érasme.
Abstract :
During the XVI th century, humanist educational programs which ptomoted the practice of commonplaces prompted printers and bookselters to create elabotate and lengthy indexes to accompany works of moral philosophy, thus allowing the reader to lool: up specific passages or information. These early printed indexes, though they contribute to the defining of texts as resources to be exploited, point up a fundamental ambiguity, since they are conceived as a means both to classify the works’ contents and to reproduce preexisting classifications of values and moral qualities. The printed index attests to the moral and philological exempiarity of the work while also anticipating the reader’s recontexmalizations of its contents.
Keywords :
index, commonplaces, printed books, Plutarch, Erasmus.

Introduction
Puisque le passé s’éclaire surtout à travers les préoccupations du présent, il ne faut pas s’étonner que les questions épistémologiques soulevées par les nouvelles technologies de l’information ont eu pour corollaire un renouveau d’intérêt pour les autres révolutions dans le domaine de la production textuelle, et notamment leur impact sur les pratiques et représentations des lecteurs-usagers de l’écrit. Dans un ouvrage assez typique de cette tendance, The Renaissance Computer (L’ordinateur de la Renaissance), N. Rhodes et J. Sawday [2000] affirment que notre entrée dans l’ère du numérique, des hypermédia, et de l’internet, a changé notre regard ‘blasé’ sur le codex, et en particulier sur le livre imprimé, qu’on ne devrait plus considérer comme un média naturel pour le stockage et la transmission des connaissances. Pour ces auteurs, l’ère de l’imprimé a en effet vu la mise en place de systèmes de recherche et de récupération d’informations et des connaissances ( knowledge retrieval systems ) pour faciliter le parcours du lecteur de plus en plus pressé, de plus en plus surchargé d’informations. L’émergence de la nouvelle technologie du livre imprimé a conduit les imprimeurs, auteurs, et libraires du XVI e siècle à mieux concevoir le livre en tant qu’outil de recherche et d’appropriation d’informations. L’interface du livre, et notamment, l’index, la mise en page, les tables de matières, et la pagination, sera donc adaptée, avec plus ou moins de succès, aux nouvelles exigences de la culture de l’imprimé, et surtout celles d’une culture humaniste, alimentée par un esprit critique qui contribue à changer le rapport du lecteur-utilisateur aux textes-sources. La culture de l’imprimé serait à l’origine d’une nouvelle façon de représenter les fonctionnements de l’esprit par rapport au livre, un peu comme aujourd’hui les métaphores du réseau et de la Toile influent sur l’imaginaire et les représentations culturelles des mécanismes de la pensée.
Et pourtant, même s’il peut être tentant d’associer mutations épistémologiques et bouleversements technologiques, l’on sait depuis longtemps que le livre de l’époque du manuscrit est doté de repères visuels et textuels (tels que tables de matières et index) qui suggèrent des pratiques de lecture orientées, et non plus ou non pas simplement, linéaires, passives [Rouse, 1989]. Quelles sont donc les spécificités et contributions de la culture de l’imprimé à l’égard de la structuration des connaissances ? En quoi le développement, pour le livre imprimé, d’outils de plus en plus complexes et précis permettant de chercher et de réexploiter son contenu nous dirige-t-il vers les pratiques des lecteurs réels ? Voici les deux questions auxquelles je tenterai d’apporter un élément de réponse. Plus précisément, je voudrais considérer le cas de l’index comme outil d’organisation des savoirs et des contenus mais aussi en tant qu’outil de recherche afin de réfléchir sur la mise en forme du livre imprimé comme manière de classer les textes et de proposer leurs usages au lecteur. Ce questionnement s’inscrit dans une approche socio-culturelle de l’histoire du livre et de la lecture, approche qui cherche à interroger les objets de la communication (textes, média, leurs mises en forme et leur usages) dans ce qu’ils révèlent et véhiculent concernant les pratiques et les représentations d’une époque.
L’intérêt d’une étude de l’index du livre imprimé réside dans le fait que, s’il devient un instrument de travail et de classement de plus en plus élaboré, surtout dans les ouvrages et compilations de philosophie morale qui sont à la base d’une pédagogie humaniste, il s’agit pourtant d’un dispositif qui semble chercher sa forme et ses fonctions. Les éditions des ouvrages philosophiques du XVI e siècle comportent souvent plusieurs index très volumineux et qui se modifient et s’allongent avec les éditions successives ; les imprimeurs et auteurs qui les proposent aux lecteurs semblent hésiter entre une classification des savoirs appliquée aux contenus, et des répertoires de thèmes et de personnages, classés par ordre alphabétique. Ces logiques de classement et de classification se côtoient souvent, et ainsi inscrivent une multiplicité de parcours de lecture et d’accès aux textes. L’index est-il un instrument qui essaie de déjouer l’effet de standardisation du livre imprimé ? Telle pourrait être une explication possible de cette multiplicité d’accès. L’étude des index se complétera donc d’une considération de quelques exemples d’annotations marginales faites par des lecteurs de l’époque pour essayer de dégager l’influence sur le lecteur des systèmes de classement des savoirs et des contenus présentés dans l’index. En effet, les éléments de l’interface du livre imprimé ne nous renseignent pas directement sur les usages réels, mais nous dirigent vers des pratiques culturelles de l’époque qui déterminent et influencent la mise en forme des livres et leur appropriation. Il importe donc d’étudier non seulement le rapport entre l’index et le lecteur, donc entre un usage prévu et l’usage réel du livre, mais aussi de resituer la mise en forme et l’appropriation des savoirs dans un contexte intellectuel et institutionnel pertinent.

1. Index et lieu commun : le contexte pédagogique
Au XVI e siècle un vif débat s’est engagé sur la manière d’effectuer des recherches à partir des lectures, débat qui était étroitement lié à une réflexion sur l’utilité, l’usage et l’exploitation des savoirs écrits, et sur les rapports entre discours et pensée. On cherchait, par de nouveaux programmes pédagogiques, à inculquer de bonnes habitudes de lecture et de composition, et selon les écoles et les perspectives, on accordait parfois plus d’importance au contenu d’un texte-source, parfois au langage et à l’expression. Un des résultats de ces programmes pédagogiques était le renforcement des outils, dont les index, permettant un repérage facilité des contenus et du style par le jeune lecteur. La présentation et la structuration des index sont directement tributaires des questionnements contemporains sur le rôle et l’efficacité des méthodes préconisées pour transmettre et organiser les savoirs et les valeurs humanistes. Parmi les méthodes les plus répandues de lecture-apprentissage, et qui va donner toute son importance à l’élaboration de l’index imprimé, on trouve la pratique des lieux communs qui devient, aux alentours de 1530 en Europe du Nord, l’instrument de pédagogie et de sociabilité par excellence [Moss, 1996]. Suivant les consignes fournies entre autres par Érasme, Mélanchton, et Vives, on enseignait aux jeunes de prélever, au fil de leurs lectures, les exemples, sentences, mots, idées, mais aussi les tournures stylistiques et les arguments, qui leur semblaient utiles et louables, pour constituer un cahier personnel classé par rubriques (topiques). Ce cahier, ou livre de lieux communs, était donc une compilation personnelle mais culturellement validée et valorisée dans lequel on pouvait puiser à volonté pour construire d’autres discours. Si les traités de l’époque révèlent des différends significatifs concernant le principe même du lieu commun (pour Mélanchton il s’agit de concepts qui reproduisent une classification au préalable de l’univers, pour Érasme, un système de classement des textes recueillis), la pratique très répandue du livre manuscrit de lieux communs, ainsi que la large diffusion de livres imprimés de lieux communs proposés comme des modèles, attestent de l’importance de ces instruments de travail, conçus à la fois comme des manuels d’expression et de rhétorique autant que de réservoirs de savoirs tirés des différentes disciplines [Goyet, 1996 ; Moss, 1996].

1.1. a Pour contenter la louable curiosâté des secteurs » : les édictions de Plutargue
Dans le contexte de ce programme pédagogique humaniste, les éditions de textes classiques tels que les œuvres de Sénèque et de Plutarque, considérés comme de véritables trésors de philosophie morale, seront dotées d’index pour faciliter le réperage de notions et de valeurs à transmettre aux jeunes élèves et aux lecteurs désireux d’alimenter leur culture personnelle en vue de leurs propres productions, que ce soit le cahier de lieux communs ou les discours que ces lieux pouvaient générer [Richardson, 1999]. L’index se présente en effet comme une sorte d’aide et propédeutique à une lecture motivée, permettant à l’utilisateur de faire une recherche ciblée. La page de titre des éditions de l’époque montre que l’index (appelé « table » ou « indice ») devient un argument de vente important. Les imprimeurs de l’époque réagissent ainsi à la généralisation d’une pratique culturelle ; la forme du livre anticipe et oriente les usages qui en sont faits.
Le cas des éditions françaises des Œuvres morales de Plutarque est particulièrement instructif. Imprimée pour la première fois en 1572 par Michel de Vascosan, la traduction française des Moralia par l’humaniste Jacques Amyot a connu un succès de librairie incontestable ; plusieurs rééditions ont vu le jour jusqu’ en 1618, qui sont quasiment toutes munies d’un index général très volumineux, présenté au lecteur comme une « table tres ample des noms, matieres, et choses notables contenues en tous les opuscules de Plutarque » [1581].
Entre 1581 et 1621 paraissent de nombreuses contrefaçons de la traduction d’Amyot. Ces éditions, qui respectent scrupuleusement le texte d’Amyot, proposent pourtant un enrichissment de l’œuvre sous forme d’un ensemble d’outils d’aide au lecteur : sommaires, annotations, et index multiples. L’auteur de cet appareil paratextuel, le théologien protestant Simon Goulart, a évidemment su répondre aux attentes des lecteurs de l’époque, car le succès des éditions S.G.S (Simon Goulart Senlisien) dépasse de loin celui des éditions autorisées [Aulotte 1965]. La page de titre de ces éditions pirates vante la présence des sommaires et préfaces, et détaille la nature des nouveaux index : « ...avec quatre indices : le premier, des Auteurs alleguez & exposez, le second, des similitudes, le troisieme des Apophtegmes, & le dernier des choses mémorables mentionnees esdites ceuvres » [1587]. Quatre index donc, à la place de l’index combiné des éditions précédentes, qui permettent au lecteur une entrée sélective dans les opuscules de Plutarque regroupés dans l’édition, selon qu’il cherche un nom propre, une métaphore, une sentence ou proverbe, ou un thème ou sujet particulier. En plus de la préface générale adressée au lecteur dans laquelle Goulart affirme avoir voulu « rendre la lecture de l’auteur facile & aimable... » et « contenter la louable curiosité des lecteurs » [1587], chacun des index est précédé d’une courte introduction à l’attention de l’usager potentiel censé se servir de ces outils d’accès comme point de départ pour sa lecture-recherche des exemples ou figures de style applicables ou adaptés à une prochaine production textuelle.
Si le principe de l’index est celui d’un répertoire de savoirs à garder en mémoire, à prélever, à recopier dans un livre de lieux communs, et à réexploiter ailleurs, il s’agit d’un répertoire qui n’est valable que par rapport au contexte d’utilisation des termes et locutions dans l’ouvrage même. Les notices qui précèdent les index insistent particulièrement sur ce point : l’ensemble de termes, ou plus souvent, de phrases ou de propositions, répertoriés dans les index, même s’ils prennent la forme d’expressions grammaticalement isolables et autonomes (à la lettre M de l’index des métaphores de l’édition 1587 nous trouvons par exemple « nous n’avons Maux que ceux que nous nous donnons »), doit, selon Goulart, être interpreté par rapport au contexte d’origine. Goulart prévient son lecteur que « c’eust ete chose inutile de les mettre nument en avant, sans en descouvrir l’usage ». S’agit-il d’une mise en garde contre une lecture hâtive (et pour Goulart, abusive) de l’index qui remplacerait la consultation de l’ouvrage même ? La tentation a dû être grande, pour des élèves et des lecteurs pressés, de se servir de l’index comme un digest de Plutarque, comme nous pouvons l’imaginer en consultant cette suite de rubriques dans l’index des Apophtegmes, à la lettre N [1587] : — Nature ne peut estre surmontee par imitation 201 h Chacun doit connaître son naturel 305b — Noblesse sans prouesse ne mérite récompense 80 d où commence et finit 999 f — Noblesse de race n ’ excuse nullement les trahisons 202 c — Noblesse quelle 219 c — Noblesse de race sans vertu ne sert de rien 221 f g — Nourriture passe nature 221 f
Dans son étude sur les livres de lieux communs, A. Moss nous apprend en effet que la nouveauté des index imprimés conduisait parfois les élèves à copier les références telles quelles sans réflexion [Moss, 1996, p. 143]. Si les index se substituent parfois à l’ouvrage même, ceci ne veut pas dire qu’ils sont dépourvus d’ambiguités et de redondances. Les quatre index de Goulart par exemple se distinguent parfois mal, malgré la division en outils séparés. Le dernier index en particulier reprend des références qui se retrouvent dans les index précédents, ce qui signale non seulement un certain flou dans la catégorisation des termes, mais aussi une reconnaissance de la polysémie des matières sélectionnées. Goulart avoue que dans le quatrième index (de loin le plus ample, avec 34 folios par rapport aux 2 à 3 folios pour les trois autres), « en ceste indice, quelques matières remarquees es 2 precedens sont repetees, mais en divers sens, ce pour aider le lecteur à trouver plus tost ce qu’il desirera voir du premier coup en ces Opuscules » [1587, f. 133v]. L’ampleur des index, et les remarques préliminaires de Goulart révèlent l’ambiguïté fondamentale de son ambition, qui semble avoir été de promouvoir une lecture scrupuleuse et minutieuse des œuvres de Plutarque tout en anticipant leurs contextualisations potentielles. Les index de Goulart semblent situer le texte, et les termes qui le constituent, entre un monument littéraire et un stock culturel, entre exemplarité et exemple.

1.2. « Quae praecipia sunt ac peculiaria » : les Adages d’Érasme
Plus tôt dans le siècle, Érasme s’était déjà lui-même heurté à cette difficulté dans l’élaboration des index qui devaient fonctionner à la fois comme un classement de contenus, une classification des savoirs, et une catégorisation des réemplois possibles. Les premiers index des Adages ont été élaborés pour faciliter la consultation d’un ouvrage qui, rappelons-le, était une vaste compilation de proverbes et locutions des auteurs antiques commentés par Érasme et présentés sans ordre apparent, Érasme ayant toujours refusé toute mise en ordre de son œuvre. Érasme s’indigne pourtant à la nature confuse des premiers index (parus en 1508), et dès 1515 il travaille lui-même à l’élaboration de quatre index qui précéderont son oeuvre (leur emplacement en tête de l’ouvrage témoigne de l’importance de ces outils dans la conception de l’édition), et qui fourniront des accès aux proverbes 1) par ordre alphabétique des matières ; 2) par lieux communs ; et 3) par ordre alphabétique des noms d’auteurs cités. Dans sa préface au lecteur Érasme s’attarde surtout sur l’organisation du premier index des matières, dans lequel il a cherché, contrairement aux réalisations précédentes qu’il critique, à faire coïncider le choix du mot sous lequel il classe le proverbe dans la liste alphabétique et le sens profond de l’adage. Érasme propose en effet sa définition du mot-clé, puisqu’il accorde un statut privilégié à des mots qui sont « remarquables » et « particuliers », « praecipia...ac peculiaria » [1551, p. aa3r]. Pour Érasme, ces mots saillants correspondent à quatre catégories : les personnes, les lieux, les êtres vivants, et les choses. Il prévient le lecteur que ce système lui a permis d’éviter les entrées multiples, mais il avoue avoir été parfois contraint de citer deux fois un proverbe dans les cas où les mots ne sortaient pas suffisamment de l’ordinaire. Ainsi le premier index des matières, noms, et lieux adopte une double logique, celle d’une représentation par des mots-clés des concepts exprimés par l’adage, et celle d’un simple index de termes.
Ce premier index est suivi d’un index des proverbes classés par lieux communs, c’est-à-dire par un ensemble de rubriques qui correspondent à des qualités morales ou intellectuelles. Ce deuxième index de topiques, qui devait particulièrement intéresser les lecteurs de l’époque, est disposé par séries d’oppositions de vices et de vertus ( forma — deformitas ; divinitiae — paupertas ). Puisqu’il suit une systématisation de valeurs, cet index propose un classement considéré comme moins arbitraire que le simple ordre alphabétique. Et pourtant Érasme signale l’ambiguïté de l’outil, et donc d’un système de classification appliqué à des textes qui sont de nature infiniment interprétables. Sous quelle rubrique morale, par exemple, classer l’adage « vase percé » ( dolium pertussum ) ? Érasme pose le dilemme dans sa préface au lecteur, en montrant que le proverbe pourrait très bien être utilisé comme exemple de qualités différentes voire contradictoires, celles par exemple de « l’avare », de « l’oublieux », ou du « prodigue ». Pour cet index, Érasme dit avoir fait des choix qui pourraient paraître arbitraires, et il invite le lecteur à compléter lui-même le travail de classement des proverbes sous les rubriques ( tituli ) qu’il estime pertinentes. Comme dans le cas des éditions de Plutarque, cette superposition de logiques d’élaboration des index, et leur séparation dans des outils distincts mais parfois redondants ou même insatisfaisants aux yeux de leurs auteurs, montrent, à un moment clé de la transmission des savoirs par le livre imprimé, une hésitation entre une classification au préalable des savoirs et un recensement exhaustif des thèmes, mots, et auteurs, hésitation qui est caractéristique d’ailleurs des traités sur l’organisation du cahier de lieux communs, comme le montre A. Moss [1996].
Dans le cas du premier index d’Érasme, on constate d’ailleurs un autre niveau de caractérisation des termes de l’index, et qui rejoint la fonction de l’index des métaphores dans les éditions de Plutarque. Les mots choisis sont soient isolés de leur contexte, soit accompagnés d’une traduction de leur usage au moyen d’un résumé ou d’une catégorisation du type de discours (argument, conseil, exemple, preuve). Cette représentation des contenus permet donc non seulement une recherche d’exemples pour appuyer des propos sur des objets culturels, mais aussi un repérage du fonctionnement rhétorique du terme ou du passage, qui peut ainsi être réutilisé pour sa valeur d’argumentation. L’index construit donc le parcours d’un lecteur à la recherche de topiques (invention) et de modalités d’expression. Par ailleurs, les index des Adages comme ceux des Œuvres morales de Plutarque, s’ils signalent parfois deux ou plusieurs occurrences d’un terme ou locution, ou recensent des mots synonymes, se limitent généralement à une seule référence, renvoyant le lecteur à un seul passage du texte : à cet égard on pourrait dire que l’index constitue en quelque sorte un démontage et une réécriture du texte, envisagé comme un fonds culturel pour la production efficace des discours.
Dans le cas des Adages, on pourrait dire que les quatre index correspondent au projet textuel et rhétorique d’Érasme dans la mesure où la copia du texte (c’est en effet la copia du verbe qui est le principe de la création textuelle pour Érasme, principe essentiel de sa pédagogie du lieu commun largement diffusée en Europe) sera simulée et mimée par l’abondance croissante des index. Et pourtant, cette hétérogénéité dans la forme et le fond des index s’avère typique d’autres éditions d’ouvrages philosophiques publiés à l’époque : paradoxalement l’index sert de validation de l’exemplarité morale et philologique des contenus, tout en mettant en question la nature univoque des signifiants répertoriés.

2. Lectures et lecteurs de l’index : de l’universel au particulier
Plus on avance dans le XVI e siècle, plus les auteurs des index vont faire le choix de l’économie, avec des renvois et des références multiples regroupés sous une seule entrée. Ce mouvement de dépouillement reste pourtant ambigu et partiel car on reste attaché au contexte particulier de l’occurrence du mot, pour, semble-t-il, respecter la spécificité de son utilisation par l’auteur tout en proposant une copia d’usages à imiter par le lecteur. L’index est donc une pratique qui universalise le contenu (le recensement du terme ou de la locution dans l’index implique et justifie son réemploi possible) et qui le singularise (l’entrée renvoie au contenu et le réécrit). L’index est-il un instrument qui essaie de contrecarrer l’effet de standardisation du livre imprimé ? On pourrait voir dans ce rapport entre le texte et sa reformulation sous forme d’index volumineux et multiples, qui font concurrence au texte, un aspect contradictoire de l’imprimé. L’imprimerie permet d’un côté de figer un texte, le stabiliser, et de l’autre, de par le nouvel appareil paratextuel, semble promouvoir une certaine exubérance scripturale suggérée par les usages potentiels du contenu.

  • Accueil Accueil
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • BD BD
  • Documents Documents