Recherche d’information contextuelle, assistée et personnalisée

-

Livres
307 pages
Lire un extrait
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

La personnalisation, la prise en compte du contexte et l’assistance aux utilisateurs constituent l’enjeu majeur de l’évolution des systèmes de recherche d’information (RI) trop souvent généralistes.
Recherche d'information contextuelle, assistée et personnalisée analyse les différentes solutions mises en œuvre dans le cadre de la recherche d’information contextuelle et développe les grands axes des programmes d’études internationaux. Il propose une présentation de la recherche d’information sous différentes facettes, mêlant informatique et linguistique (résumé automatique, analyse syntaxique, etc.) mais aussi sciences cognitives (profils utilisateur, interfaces de visualisation, aides à la navigation).
La robustesse des systèmes automatiques face à des documents audio ou des textes mal orthographiés et le rôle de l’utilisateur dans le processus de recherche (collaboration et interaction) y sont développés.
La prise en compte de certains handicaps est également traitée (dyslexies et estimation de la difficulté de lecture, handicaps moteurs et aide à la saisie par prédiction de mots), témoignant de l’adaptation et de l’amélioration progressive des systèmes de recherche d’information (RI).
Introduction. CONTEXTE ET ROBUSTESSE. Chapitre 1. Recherche d'information contextuelle : le cas des requêtes. Chapitre 2. Robustesse et analyse syntaxique. Chapitre 3. La recherche d'information face à des corpus et requêtes bruités. Chapitre 4. Questions-réponses sur des documents audio. PERSONNALISATION ET COLLABORATION. Chapitre 5. Recherche d'information et modélisation usagers. Chapitre 6. Recherche d'information collaborative. Chapitre 7. Difficultés de lecture, dyslexies et recherche d'information. ASSISTANCE ET AIDE À LA NAVIGATION. Chapitre 8. Navigation dans les documents audio par le résumé automatique. Chapitre 9. Interaction. Chapitre 10. Prédiction de mots et saisie de requêtes sur interfaces limitées : dispositifs mobiles et aide au handicap. Bibliographie. Index.

Sujets

Informations

Publié par
Date de parution 14 septembre 2011
Nombre de visites sur la page 16
EAN13 9782746241862
Langue Français

Informations légales : prix de location à la page 0,0592 €. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Signaler un problème








Recherche d’information contextuelle, assistée et personnalisée


































© LAVOISIER, 2011
LAVOISIER
11, rue Lavoisier
75008 Paris

www.hermes-science.com
www.lavoisier.fr

ISBN 978-2-7462-2583-1
ISSN 1968-8008


Le Code de la propriété intellectuelle n'autorisant, aux termes de l'article L. 122-5, d'une part,
que les "copies ou reproductions strictement réservées à l'usage privé du copiste et non
destinées à une utilisation collective" et, d'autre part, que les analyses et les courtes citations
dans un but d'exemple et d'illustration, "toute représentation ou reproduction intégrale, ou
partielle, faite sans le consentement de l'auteur ou de ses ayants droit ou ayants cause, est
illicite" (article L. 122-4). Cette représentation ou reproduction, par quelque procédé que ce
soit, constituerait donc une contrefaçon sanctionnée par les articles L. 335-2 et suivants du
Code de la propriété intellectuelle.
Tous les noms de sociétés ou de produits cités dans cet ouvrage sont utilisés à des fins
d’identification et sont des marques de leurs détenteurs respectifs.


Printed and bound by CPI Group (UK) Ltd, Croydon, CR0 4YY, September 2011






Recherche d’information

contextuelle, assistée

et personnalisée








sous la direction de
Patrice Bellot












Direction éditoriale Jean-Charles Pomerol

COLLECTION RECHERCHE D’INFORMATION ET WEB
SOUS LA DIRECTION DE BERNADETTE BOUCHON-MEUNIER

Résumé automatique de documents – Juan-Manuel Torres-Moreno, 2011
Modèles statistiques pour l’accès à l'information textuelle – Eric Gaussier et
François Yvon, 2011
Sémantique et multimodalité en analyse de l'information – Marine Campedel et
Pierre Hoogstoel, 2011
Recherche d’information : état des lieux et perspectives – Mohand Boughanem
Mohand et Jacques Savoy, 2008
























Liste des auteurs


Jean-Yves ANTOINE Benoit FAVRE
LI – Lab-STICC LIF
Université François Rabelais/CNRS Université d’Aix-Marseille/CNRS
Tours Marseille

Patrice BELLOT Olivier GALIBERT
LSIS LIMSI
Université d’Aix-Marseille/CNRS Université Paris Sud/CNRS
Orsay
Philippe BLACHE
LPL Mountaz HASCOËT
Université d’Aix-Marseille/CNRS LIRMM
Université Montpellier II/CNRS
Guillaume CABANAC
IRIT Gilles HUBERT
Université Paul Sabatier/CNRS IRIT
Toulouse Université Paul Sabatier/CNRS
Toulouse
Max CHEVALIER
IRIT Christine JULIEN
Université Paul Sabatier/CNRS IRIT
Toulouse Université Paul Sabatier/CNRS
Toulouse
Alexandra CIACCIA
PPCC Lori LAMEL
Université Paris Ouest Nanterre LIMSI
La Défense Université Paris Sud/CNRS
Orsay
Céline CLAVEL
LIMSI Josiane MOTHE
Université Paris Sud/CNRS IRIT
Orsay Université Paul Sabatier/CNRS
Toulouse
Nathalie DENOS
LIG Stéphane RAUZY
Université Joseph Fourier/CNRS LPL
Grenoble Université d’Aix-Marseille/CNRS



Sophie ROSSET Chantal SOULÉ-DUPUY
LIMSI IRIT
Université Paris Sud/CNRS Université Toulouse 1 Capitole/CNRS
Orsay
André TRICOT
Laurianne SITBON CLLE-LTC
NICTA/QUT Université Toulouse Le Mirail/CNRS
Queensland University of
Technology
Brisbane
Australie

Table des matières
Introduction........................................ 15
PREMIÈRE PARTIE. CONTEXTE ET ROBUSTESSE.................. 25
Chapitre 1. Recherche d’information contextuelle :
le cas des requêtes.................................... 27
Josiane MOTHE
1.1. Introduction 27
1.2. Types de requêtes ................................ 29
1.2.1. Requêtes populaires ou répétées .................... 30
1.2.2. Requêtes reformulées et historique des requêtes........... 33
1.2.3. Requêtes difficiles ............................ 35
1.2.3.1. Variabilité des systèmes...................... 35
1.2.3.2. Prédiction de la difficulté d’une recherche ........... 37
1.3. Classification de requêtes ........................... 39
1.3.1. Classification thématique ........................ 40
1.3.2. Classification de requêtes basée sur leurs caractéristiques ..... 42
1.3.3. Classer les requêtes selon leurs performances ............ 42
1.4. Adapter les traitements aux requêtes ..................... 44
1.4.1. Variabilité et fusion de systèmes comme point de départ ..... 44
1.4.2. Choisir les traitements en fonction des requêtes ........... 45
1.4.3. Choisir le meilleur moteur pour chaque requête 45
1.4.3.1. Choix du meilleur système pour chaque besoin
d’information................................. 46
1.4.3.2. Performance en fonction du groupe
de besoin d’information ........................... 46












8 RI contextuelle, assistée et personnalisée
1.5. Conclusion .................................... 48
1.6. Bibliographie ................................... 50
Chapitre 2. Robustesse et analyse syntaxique................... 57
Philippe BLACHE et Stéphane RAUZY
2.1. Introduction 57
2.2. Les situations 58
2.3. Le cas de la recherche d’information..................... 60
2.4. Les techniques .................................. 60
2.4.1. Etiquetage et désambiguisation 61
2.4.2. Analyse syntaxique ............................ 62
2.4.2.1. Analyse syntaxique superficielle symbolique ......... 63
2.4.3. Analyse syntaxique superficielle stochastique ............ 64
2.4.4. Bilan..................................... 65
2.5. Une approche syntaxique intrinsèquement robuste :
les Grammaires de Propriétés ........................... 66
2.5.1. Les caractéristiques des Grammaires de Propriétés......... 66
2.5.2. Les mécanismes d’analyse en GP ................... 67
2.6. Conclusion .................................... 69
2.7. Bibiographie ................................... 70
Chapitre 3. La recherche d’information face à des corpus
et requêtes bruités 73
Laurianne SITBON
3.1. Introduction.................................... 73
3.2. Les bruits de l’information ........................... 74
3.2.1. Les erreurs de pré-traitement ...................... 75
3.2.1.1. Requêtes et corpus audio ..................... 75
3.2.1.2. Requêtes translingues ....................... 75
3.2.1.3. Corpus manuscrits ......................... 76
3.2.2. Les erreurs de l’utilisateur........................ 76
3.2.2.1. Les échecs de la dictée 76
3.2.2.2. Les handicaps de langage 77
3.2.2.3. Les erreurs volontaires 77
3.2.3. L’évolution des langues......................... 77
3.3. L’impact du bruit sur l’efficacité des systèmes
de recherche d’information ............................. 78
3.3.1. Campagnes d’évaluation......................... 78

























Table des matières 9
3.3.2. Evaluation de la recherche documentaire
avec des données bruitées ............................ 79
3.4. Evaluation détaillée d’un système de questions-réponses
face à des requêtes non standards ......................... 80
3.4.1. Sélection des requêtes .......................... 80
3.4.2. Collecte des requêtes ........................... 81
3.4.3. Analyse des échecs de SQuALIA ................... 82
3.4.3.1. Analyse de la question....................... 83
3.4.3.2. Sélection des passages et des réponses ............. 84
3.4.3.3. Résultats finaux 85
3.5. Systèmes de recherche documentaire robustes au bruit .......... 85
3.5.1. Modélisation des erreurs et entraînement des systèmes
en conditions bruitées .............................. 86
3.5.2. Prise en compte de l’incertitude – Utilisation de scores
de confiance .................................... 86
3.5.3. Utilisation de modèles thématiques .................. 88
3.6. Prise en compte de solutions multiples pour la réécriture
de questions ...................................... 88
3.6.1. Approche grapho-phonémique à la réécriture de questions .... 88
3.6.2. Modèle probabiliste pour la prise en compte de l’incertitude
dans les SRI complexes ............................. 90
3.6.3. Evaluation du pré-traitement en vue d’une utilisation
avec un modèle basé sur l’incertitude ..................... 92
3.7. Conclusion 95
3.8. Bibliographie ................................... 96
Chapitre 4. Questions-réponses sur des documents audio........... 99
Olivier GALIBERT, Sophie ROSSET et Lori LAMEL
4.1. Introduction.................................... 99
4.2. Campagnes d’évaluation ............................ 101
4.2.1. Les documents............................... 102
4.2.2. Les questions 103
4.2.3. Les métriques 105
4.3. Systèmes de questions-réponses sur de la parole .............. 105
4.3.1. Systèmes de questions-réponses .................... 106
4.3.2. Traiter la parole .............................. 108
4.3.3. Approches utilisées dans QAst ..................... 109
4.3.3.1. Analyse des documents ...................... 110
4.3.3.2. Recherche d’information 112

























10 RI contextuelle, assistée et personnalisée
4.3.4. Résultats .................................. 113
4.3.4.1. Résultats globaux.......................... 113
4.3.4.2. Discussions ............................. 115
4.4. Conclusions et perspectives 120
4.5. Bibliographie ................................... 121
DEUXIÈME PARTIE. PERSONNALISATION ET COLLABORATION ......... 125
Chapitre 5. Recherche d’information et modélisation usagers ........ 127
Guillaume CABANAC, Max CHEVALIER, Alexandra CIACCIA, Céline CLAVEL,
Christine JULIEN, Gilles HUBERT, Chantal SOULÉ-DUPUY et André TRICOT
5.1. Introduction.................................... 127
5.2. Modélisation informatique des usagers dans les SRI ........... 128
5.2.1. Dimensions de l’usager exploitées par les SRI
pour la personnalisation ............................. 129
5.2.2. Sources privilégiées pour la collecte d’informations
pour la modélisation usager ........................... 131
5.2.3. Modèles usager (stockage des informations dans le SRI) ..... 132
5.3. Les usagers des outils de RI : aspects cognitifs............... 133
5.3.1. Tâche et RI................................. 134
5.3.2. Outils et RI 135
5.3.3. Caractéristiques individuelles et RI .................. 136
5.4. Discussion sur la prise en compte des usagers dans les SRI ....... 138
5.4.1. Limites de l’utilisation des modèles usagers dans les SRI ..... 139
5.4.2. Recommandations générales ...................... 141
5.4.2.1. Recommandations relatives aux modèles usagers
informatisés .................................. 141
5.4.2.2. Recommandations relatives aux aspects cognitifs
de l’usager ................................... 142
5.5. Conclusion .................................... 144
5.6. Bibliographie 144
Chapitre 6. Recherche d’information collaborative ............... 153
Nathalie DENOS
6.1. Introduction 153
6.2. Qu’est-ce que la recherche d’information collaborative ? ........ 153
6.2.1. Contexte et motivation .......................... 153
6.2.2. Définition et vue d’ensemble des approches ............. 154

























Table des matières 11
6.3. Origines ...................................... 156
6.3.1. La collaboration telle qu’observée sur le terrain ........... 156
6.3.2. L’émergence de paradigmes de recherche d’information
collaborative.................................... 157
6.4. Cadre d’analyse ................................. 158
6.4.1. Les principaux axes de classification ................. 158
6.4.2. Classification des paradigmes de recherche d’information
collaborative médiatisée ............................. 158
6.4.2.1. Temps et espace .......................... 158
6.4.2.2. Intention ............................... 159
6.4.2.3. Profondeur de la médiation .................... 159
6.5. Recherche d’information collaborative asynchrone ............ 160
6.5.1. Filtrage collaboratif et systèmes de recommandation........ 160
6.5.1.1. Principe du filtrage collaboratif ................. 160
6.5.1.2. Technique de base et principal intérêt.............. 161
6.5.1.3. Evolution des techniques ..................... 162
6.5.2. Partage de traces ............................. 163
6.5.2.1. Principe du partage de traces ................... 163
6.5.2.2. Description des principales techniques ............. 163
6.5.3. Reclassement collaboratif des résultats de recherche ........ 164
6.5.3.1. Principe du reclassement collaboratif .............. 164
6.5.3.2. Description des principales techniques 164
6.5.4. Synthèse sur la recherche collaborative asynchrone......... 166
6.6. Recherche d’information collaborative synchrone ............. 166
6.6.1. Recherche synchrone à distance .................... 166
6.6.1.1. Outils de conscience réciproque (group awareness) ..... 167
6.6.1.2. Outils de coordination ....................... 168
6.6.2. Recherche collaborative synchrone en présence ........... 173
6.6.2.1. Principe de la recherche synchrone en présence........ 173
6.6.2.2. Description des principales techniques ............. 173
6.6.3. Synthèse sur la recherche collaborative synchrone ......... 175
6.7. Evaluation des systèmes de recherche d’information collaborative . . . 176
6.7.1. Objectifs de qualité ............................ 176
6.7.1.1. Caractéristiques des recherches collaboratives ........ 176
6.7.1.2. Critères d’évaluation........................ 176
6.7.2. Approches d’évaluation ......................... 178
6.7.2.1. Tests utilisateurs en laboratoire ................. 178
6.7.2.2. Evaluation en laboratoire avec simulation
des utilisateurs ................................ 179
6.7.2.3. Bases de comparaison ....................... 180
6.7.3. Synthèse sur l’évaluation 181




































12 RI contextuelle, assistée et personnalisée
6.8. Conclusion .................................... 182
6.8.1. Synthèse sur la recherche d’information collaborative ....... 182
6.8.2. Perspectives ................................ 182
6.9. Bibliographie ................................... 184
Chapitre 7. Difficultés de lecture, dyslexies
et recherche d’information .............................. 191
Patrice BELLOT
7.1. Introduction 191
7.2. Modélisation cognitive de la lecture ..................... 194
7.3. Critères pour estimer la difficulté de lecture d’un texte .......... 199
7.4. Mesures de lisibilité............................... 204
7.4.1. Les mesures de lisibilité FOG, SMOG et celles de Flesch ..... 204
7.4.2. Des mesures apprises automatiquement et adaptées
aux utilisateurs .................................. 205
7.5. Prise en compte de la lisibilité en RI ..................... 207
7.5.1. La pertinence en recherche documentaire............... 207
7.5.2. Réordonnancement des documents trouvés
selon la mesure de Flesch ............................ 207
7.5.3. Vers d’autres combinaisons de la pertinence et de la lisibilité. . . 208
7.6. La dyslexie comme trouble du langage ................... 211
7.6.1. Différentes dyslexies ........................... 212
7.6.2. Proposition d’une mesure de lisibilité adaptée à la dyslexie .... 214
7.7. Perspectives et conclusion 216
7.8. Bibliographie ................................... 218
TROISIÈME PARTIE. ASSISTANCE ET AIDE À LA NAVIGATION .......... 227
Chapitre 8. Navigation dans les documents audio
par le résumé automatique .............................. 229
Benoit FAVRE
8.1. Introduction.................................... 229
8.2. Recherche d’information parlée........................ 231
8.2.1. Recherche documentaire......................... 231
8.2.2. Résumé automatique ........................... 233
8.3. Interactions avec l’utilisateur 235
8.3.1. Navigation locale ............................. 235
8.3.2. Navigation orientée contenu....................... 237

























Table des matières 13
8.4. Conclusion .................................... 243
8.5. Bibliographie ................................... 244
Chapitre 9. Interaction ................................. 249
Mountaz HASCOËT
9.1. Introduction 249
9.2. Analyse de l’interaction par l’analyse des tâches.............. 250
9.3. Les styles d’interaction classiques ...................... 253
9.3.1. Les facettes 253
9.3.2. Le filtrage dynamique .......................... 254
9.3.3. Le brossage ................................ 255
9.3.4. Le pliage .................................. 256
9.3.5. Le zoom : bitmap, structurel ou sémantique ............. 257
9.3.6. La conciliation détails et contexte ................... 258
9.3.6.1. Fisheye déformant ......................... 261
9.3.6.2. e déformant et structurel ................. 261
9.3.7. Interaction coopérative et dispositifs d’affichage distribués .... 262
9.3.8. Passage à l’échelle ............................ 262
9.3.9. Vers une interaction plus directe .................... 263
9.4. Conclusion .................................... 265
9.5. Bibliographie ................................... 266
Chapitre 10. Prédiction de mots et saisie de requêtes
sur interfaces limitées : dispositifs mobiles et aide au handicap ....... 273
Jean-Yves ANTOINE
10.1. Introduction : saisie de message sur interfaces limitées ......... 273
10.2. Interfaces limitées : dispositifs d’entrée .................. 275
10.2.1. Dispositifs d’entrée de texte pour systèmes
informatiques mobiles .............................. 275
10.2.2. Dispositifs d’entrée de texte pour systèmes
d’aide à la communication ........................... 279
10.2.3. Evaluer l’intérêt de la prédiction de mots pour la saisie
de message..................................... 282
10.3. Prédiction de lettres et claviers virtuels dynamiques ........... 283
10.4. Prédiction de mots : retour historique
et modèles markoviens de base 285
10.5. Modèles adaptatifs pour la prédiction de mots .............. 287
10.5.1. Adaptation utilisateur.......................... 287


























14 RI contextuelle, assistée et personnalisée
10.5.2 Adaptation au contexte courant du discours :
analyse sémantique latente ........................... 290
10.6. Conclusion : pour une meilleure intégration ergonomique
de la prédiction .................................... 295
10.7. Bibliographie .................................. 295
Index ............................................ 299


Introduction
Dans un article récent sur les enjeux de la recherche d’informations (RI), N.J.
Belkin [BEL 08a] rappelle que la question de la personnalisation est annoncée
comme majeure depuis une vingtaine d’années mais que la plupart des tentatives
vers une étude systématique ont échoué. S’il n’est pas question de prétendre que les
propositions de ces vingt dernières années n’ont abouti à rien, force est de constater
qu’aussi bien des paradigmes d’évaluation que des stratégies efficaces restent encore
à trouver et que l’utilisateur n’intervient que très peu dans les systèmes de recherche
d’Internet.
La problématique de la personnalisation, de la prise en compte de l’utilisateur et
du contexte de recherche (adaptation et assistance) en RI renvoie à la question des
modèles théoriques de recherche d’information, au croisement de la linguistique et
de l’informatique, des sciences cognitives et des neurosciences, pour l’étude des
comportements individuels et des structures physiologiques liées au langage, ou
encore de la sociologie et de la sémiologie pour des analyses globales des besoins,
des usages et des significations. Ce croisement pluridisciplinaire est un enjeu majeur
des années à venir si l’on veut aller au-delà des systèmes actuels.
Cet ouvrage s’adresse aux chercheurs, académiques ou industriels, doctorants ou
étudiants de master, intéressés par le déploiement, éventuellement à grande échelle,
de solutions efficaces pour la recherche d’information. S’il ne prétend pas aborder
de façon exhaustive l’ensemble des thèmes liés à la RI contextuelle, assistée et
personnalisée, il a pour objectif de donner un large aperçu des principales solutions
en œuvre dans les systèmes de recherche actuels et des grands problèmes ouverts
qui font l’objet de programmes de recherche internationaux et qui témoignent
de l’éventail des disciplines et orientations méthodologiques en jeu : méthodes
numériques et symboliques, de surface ou profonde, à base d’apprentissage
automatique ou non, etc. 16 RI contextuelle, assistée et personnalisée
Rappelons pour commencer qu’un modèle informatique de recherche
d’information a pour but de fournir une formalisation du processus de recherche. Il
doit accomplir plusieurs rôles dont le plus important est de fournir un cadre
théorique pour la modélisation de la mesure de pertinence. De nombreux modèles
symboliques ou numériques ont été proposés depuis les années 1960 parmi lesquels
1 2le modèle booléen, le modèle vectoriel , le modèle probabiliste [ROB 76], le
modèle booléen étendu [SAL 83], le modèle vectoriel étendu basé sur l’indexation
sémantique latente (LSI [DEE 90]), les modèles probabilistes à base de modèles de
langue [PON 98, BOU 04] et les modèles connexionnistes [KWO 95]. Pour une
présentation détaillée de ces modèles, le lecteur peut se reporter par exemple à
[BAE 99, SAV 03, BEL 08b]. Si leur compréhension peut aider à lecture et à la mise
en perspective des chapitres qui suivent, elle n’en est pas un pré-requis.
Par opposition aux approches symboliques, les méthodes numériques, fondées
sur une étude statistique et des modèles probabilistes, ont prouvé leur grande
capacité à s’adapter rapidement à diverses thématiques ou langues et sont très
largement utilisées en recherche d’information même si cela s’est fait au prix d’une
certaine approximation dans les résultats, toujours exacts dans les approches
symboliques à base de règles pourvu que celles-ci soient justes et complètes. Ces
deux orientations, symbolique et numérique, ont longtemps été opposées, chacun de
ses partisans se distinguant par des positions philosophiques tranchées et par des
attitudes plus ou moins pragmatiques. Cette opposition rejoint en quelque sorte celle
qui a opposé, et oppose toujours, certains linguistes et philosophes sur la nature

1. Le modèle vectoriel représente les documents et les requêtes par des vecteurs de mots-clés.
Ces mots-clés sont eux-mêmes extraits des textes lors de la phase d’indexation. Pour chaque
document, un poids est attribué à chacun des mots-clés qu’il contient en fonction de différents
critères statistiques. Dans le modèle vectoriel, le vecteur requête est représenté dans le même
espace que les vecteurs documents. Le vecteur requête peut alors être comparé à chacun des
vecteurs documents. Cette comparaison correspond au calcul d’une similarité (ou distance)
entre les vecteurs documents et le vecteur requête. Les différentes valeurs de similarité
permettent d’ordonner les documents trouvés.
2. Le modèle probabiliste [ROB 76] permet de représenter le processus de recherche
documentaire comme un processus de décision : le coût, pour l’utilisateur, associé à la
récupération d’un document, doit être minimisé. Autrement dit, un document n’est proposé à
l’utilisateur que si le coût associé à cette proposition est inférieur à celui de ne pas le
retrouver. Une autre manière de voir le modèle probabiliste est de considérer que celui-ci
cherche à modéliser l’ensemble des documents pertinents, autrement dit à estimer, par
apprentissage automatique à partir d’avis donnés par les utilisateurs sur les documents, la
probabilité qu’un mot donné apparaisse dans de tels documents. De nombreuses méthodes
d’apprentissage ont été proposées, à partir d’approches bayésiennes [BOO 83], de modèle
2Poisson ou bien de mixture de distributions de Poisson. Robertson et ses collègues ont par la
suite intégré au modèle probabiliste originel la possibilité de tenir compte de la fréquence
d’apparition des mots dans les documents et dans la requête, ainsi que de la longueur des
documents. Cela a donné lieu à la famille de pondérations BM (Best Match) dont la célèbre
BM25. Introduction 17
même du langage et son acquisition à savoir, en simplifiant à l’extrême, la
préexistence ou non d’un système (cognitif et physiologique) de règles génératrices
des phrases possibles au sein d’une langue (ou tout du moins de leur degré de
préexistence). Dans les années 1950, le courant béhavioriste, largement empiriste, a
tenté de définir l’acquisition du langage comme un apprentissage sous forme de
réactions en chaîne par rapport à des renforcements positifs ou négatifs. Durant la
même période, N. Chomsky a suggéré la préexistence de structures cognitives
spécifiques au langage et propres à l’être humain [GRO 07]. Une conséquence
directe de l’hypothèse de préexistence de structures grammaticales pour l’acquisition
du langage a incité à définir à la fois une grammaire universelle exprimant les
universaux linguistiques et des grammaires particulières pour les spécificités des
multiples langues introduisant ainsi les problèmes de généralisation et de robustesse
des modèles linguistiques [CHO 64]. Ultérieurement, les grammaires particulières
ont été réduites à des valeurs spécifiques de paramètres de la grammaire universelle,
l’acquisition d’une langue correspondant ainsi en la fixation de ces paramètres
[CHO 81].
La notion d’apprentissage est bien sûr de première importance. Elle peut être vue
sous deux angles qui rejoignent la problématique évoquée plus haut, à savoir
apprentissage statistique ou symbolique, tous deux naturellement inconscients, et,
probablement, combinés. Dans le premier cas, il s’agit, pour l’enfant, d’observer
lesquelles de ses productions linguistiques aboutissent au but recherché et, de
manière évolutive, d’accumuler une sorte de comptabilité de ce qui réussit et de ce
qui échoue. Ce type d’apprentissage peut être artificiellement modélisé par des
réseaux neuro-mimétiques faisant intervenir différentes couches cachées reliant,
entre autre, lexique(s), concepts et phonèmes de la langue ; l’intention (le but
recherché) étant alors associée à un ou plusieurs chemins particuliers au sein du
réseau. Le succès ou l’échec se traduisent par un renforcement ou un affaiblissement
des connexions. Bien sûr, aucune simulation n’est encore parvenue à reproduire le
3langage humain dans son étendue sémantique et comportementale . La question de
la convergence de l’apprentissage se pose par rapport aux nécessaires besoins
d’adaptation dynamique (plasticité neuronale), aussi bien que celle de la réduction
de la combinatoire, sachant qu’il sera presque impossible d’aboutir un jour à une
modélisation mathématique exacte des centaines de milliards de neurones et du
million de milliards de synapses du cerveau humain. Remarquons qu’à la suite d’un
strict apprentissage statistique, il peut être possible de relever, une fois le modèle
ayant acquis une certaine stabilité (cette stabilité n’est jamais totale, comme le
prouvent, au quotidien, nos capacités d’adaptation et d’apprentissage, y compris
chez l’adulte), des régularités structurelles parmi ses productions à partir desquelles
une grammaire peut à son tour être induite. En ce sens, la grammaire pourrait alors

3. On suivra avec attention le projet Blue Brain lancé en 2011, http://bluebrain.epfl.ch/ et on
se reportera au modèle Caramel et à ses implémentations [SAB 96, SAB 99].
18 RI contextuelle, assistée et personnalisée
n’être « que » la représentation formelle, l’image synthétique, de l’émergence d’un
état particulier au sein du système complexe qu’est le cerveau.
Concernant le second point de vue, génération de phrases à partir de structures
préétablies, des interrogations sur sa pertinence sont soulevées qui concernent à la
fois l’ensemble des productions s’écartant de la grammaire mais pourtant
compréhensibles (au sens où un enfant peut tout à coup construire incorrectement
une phrase qui aurait pourtant dû respecter une forme syntaxique qu’il maîtrise par
4ailleurs) et les conséquences linguistiques propres à certains troubles du langage
difficiles à modéliser.
Ici encore, les interprétations sont multiples mais l’on pourra relever celle
exprimée dans [JAK 07] : [...] je propose que les différences observées par rapport
au système adulte, transitoires chez l’enfant sain, de durée plus longue ou indéfinie
chez l’enfant atteint d’un trouble spécifique du langage, ne relèvent en fait pas de
l’engin syntaxique lui-même mais d’opérations post-syntaxiques par lesquelles les
représentations construites par cet engin sont matérialisées.
5Les découvertes récentes de l’imagerie médicale fonctionnelle ne permettent pas
à elles seules de décider de la validité de l’une ou l’autre des hypothèses. Si l’on
parvient à déterminer au moins approximativement les zones du cerveau propres à
la prononciation mentale (aire de Broca comme étape pré-articulatoire), la détection
de phonèmes (partie antérieure de l’aire de Wernicke) ou encore les aires visuelles
distinctes pour la reconnaissance des visages, la représentation mentale des lieux
ou des mots écrits (différentes zones qui sont en jeu dans la lecture) [DEH 07],
il est plus délicat de déterminer une localisation précise d’un quelconque engin
syntaxique.

4. Si les modèles numériques sont par nature robustes, ça n’est pas le cas de la plupart des
modèles symboliques. Face à l’incapacité des grammaires chomskyennes à considérer les
énoncés qu’elles ne peuvent générer (et qui seraient donc en ce sens en dehors du langage),
d’autres grammaires ont été proposées telles que les grammaires de propriétés [BLA 00].
Elles fournissent « [...] une vision de la langue comme un tout, dans laquelle chaque domaine
[phonologie, syntaxe, sémantique...] possède son propre système de description (ou
grammaire), les interactions étant contrôlées par un niveau supérieur. [...] La possibilité de
rendre compte de la langue en situation et dans une perspective communicationnelle tout en se
situant dans une approche formelle confère ainsi pleinement un aspect cognitif à la théorie. »
[BLA 03].
5. Certains auteurs vont jusqu’à spécifier des aires corticales spécifiques à certains verbes,
d’action en liaison avec les zones neuronales du système moteur [RIZ 08]. Ainsi certaines
neurones discrimineraient l’information sensorielle suivant les possibilités d’action qu’elle
offre (formes, dimensions...) et l’activation de neurones miroirs potentiellement associés à des
actes moteurs serait liée à des actions (intentions) et non à des mouvements corporels
particuliers. Introduction 19
Finalement, les propositions et modèles qui découlent des travaux de N.
Chomsky ne paraissent pas incompatibles avec une vision béhavioriste relativisée
([HAR 93] cité par [SAB 06]). Au lieu d’opposer modélisations strictement
neuronales et grammaire générative avec structures innées, il est possible de postuler
l’existence de réseaux neuronaux ayant une structure initiale propice à l’acquisition
du langage, à la fois en respect avec une grammaire universelle et en accord avec
la nécessité d’interconnexion avec les aires cognitives non spécifiques au langage :
le réseau forme bien un tout. Cette approche est alors en partie (mais en partie
seulement) conforme au modèle d’une conscience humaine définie comme une
dynamique neuronale [EDE 07] dans laquelle l’apprentissage par renforcement
(processus de sélection) est contraint par le code génétique tout en étant sensible à
l’expérience.
Quoiqu’il en soit, nous croyons que l’un des principaux acquis du traitement
automatique des langues de ces dernières années est qu’il est nécessaire, au moins en
l’état des connaissances et des capacités computationnelles des machines, de ne pas
se cantonner soit dans une approche entièrement numérique, soit (j’oserais dire
encore moins) dans une approche uniquement symbolique. A ce titre, la robustesse
des modèles face aux phénomènes linguistiques rencontrés, qu’ils soient corrects ou
non, tels que ceux en provenance de données orales ou produites par des utilisateurs
présentant des handicaps langagiers (physiologiques ou, tout simplement, dus à une
méconnaissance de la langue), est une problématique centrale. Les approches
dynamiques de la cognition artificielle, les méthodes d’apprentissage automatique
basées sur le renforcement [MUN 97] et la réentrance, doivent encore être
approfondies et adaptées en profitant de leur apparente adéquation supérieure avec
les processus cognitifs qui régissent notre cerveau. La capacité des modèles
numériques neuro-mimétiques à rendre compte de certaines déficiences cognitives et
les modèles hybrides en œuvre dans les plus récents systèmes de recherche
d’information précise (moteurs de questions-réponses) sont autant d’arguments en
faveur d’une voie interdisciplinaire centrée sur l’individu et ses capacités à manier le
langage. Ils sont autant d’aspects qui, à différents niveaux, sont abordés dans les
chapitres qui suivent.
Cet ouvrage est subdivisé en trois parties. La première partie concerne la notion
de contexte en recherche d’information (RI) et la robustesse des modèles
informatiques et linguistiques employés sur des textes et requêtes réels.
Le chapitre 1, rédigée par Josiane Mothe, définit et délimite la notion de
contexte (type d’information recherchée, quantité de documents désirée, usage de
l’information recherchée...) et s’intéresse plus particulièrement à la manière dont
celui-ci peut être détecté automatiquement en analysant les requêtes posées par les
utilisateurs. Une typologie des requêtes est proposée, qui distingue les requêtes
populaires, les reformulations et les différents niveaux de difficulté associés. Elle
20 RI contextuelle, assistée et personnalisée
permet d’aborder le problème de la classification automatique des requêtes selon
différentes facettes ainsi que l’adaptation des méthodes de recherche et le choix du
meilleur système pour y répondre.
Le chapitre 2, rédigé par Laurianne Sitbon, aborde la question de la robustesse en
RI par le prisme du traitement de requêtes bruitées telles qu’elles peuvent l’être
lorsqu’elles sont issues de transcription automatique d’un signal audio ou, tout
simplement, d’utilisateurs dont l’orthographe n’est pas parfaite. Une estimation de
l’impact du bruit sur diverses tâches de RI est proposée par l’intermédiaire d’une
étude de résultats obtenus lors de campagnes internationales d’évaluation.
Une analyse approfondie du type de bruit et de son impact est fournie pour la
tâche questions-réponses en faisant intervenir des utilisateurs francophones,
non francophones et dyslexiques. La seconde partie du chapitre est consacrée à
l’estimation automatique de l’incertitude et propose un modèle probabiliste de RI
la prenant en compte. Les performances de ce modèle sont illustrées au moyen de
son application à la génération automatique d’hypothèses de réécriture de questions
en langue naturelle à partir d’une analyse grapho-phonémique.
Le chapitre 3, rédigé par Philippe Blache et Stéphane Rauzy, concerne la
question de la robustesse d’une des applications phare du traitement automatique
des langues naturelles (TALN) qui est l’analyse syntaxique. Cette dernière constitue
l’une des voies envisagées pour améliorer la qualité de la recherche d’information,
notamment de type questions-réponses, grâce à l’exploitation d’informations
linguistiques permettant de mettre en relation les mots d’un texte. Partant du
principe que seule une analyse robuste peut permettre une intégration efficace de
l’analyse linguistique en RI, différentes méthodes sont présentées et l’approche à
base des grammaires de propriétés est détaillée.
Le chapitre 4 est écrit par Olivier Galibert, Sophie Rosset et Lori Lamel. Il
aborde la question de la recherche d’information précise (tâche questions-réponses)
sur des documents audio. Il présente les différentes campagnes d’évaluation
internationales durant lesquelles des transcriptions de l’audio ont été utilisées ainsi
que les métriques employées pour mesurer les performances des moteurs de
recherche. Les différentes approches pour aborder ce problème sont présentées en
même temps qu’une analyse des principaux points spécifiques à l’audio, notamment
en termes de robustesse. La dernière partie du chapitre décrit les principaux résultats
obtenus par les systèmes actuels.
La deuxième partie de l’ouvrage concerne la personnalisation de la RI et la place
de l’utilisateur dans le processus de recherche.
Le chapitre 5, rédigé par Guillaume Cabannac, Max Chevalier, Alexandra
Ciaccia, Céline Clavel, Christine Julien, Gilles Hubert, Chantal Soule-Dupuy et Introduction 21
André Tricot, s’intéresse à la place de l’usager dans le développement de systèmes
d’information au croisement de l’informatique et de l’ergonomie cognitive. Ce
double éclairage permet de souligner les différentes manières d’appréhender et de
caractériser l’utilisateur selon le point de vue choisi. Différents types d’indicateurs et
de données sont mentionnés et leur usage en RI discuté. La question de l’évaluation
est centrale et la prise en compte des aspects cognitifs est abordée.
Le chapitre 6, écrit par Nathalie Denos, concerne la recherche d’information
collaborative. Il souligne la dimension sociale du processus de recherche à partir des
travaux qui ont analysé les différentes formes de collaboration entre utilisateurs.
Plusieurs facettes de la RI collaborative sont discutées selon sa nature (asynchrone
ou synchrone), les communautés d’utilisateurs impliquées et le niveau de médiation.
La recherche d’information collaborative asynchrone (filtrage collaboratif et
recommandation) puis synchrone (coordination, partage du travail et des connaissances, en
présence ou à distance) sont discutées au travers des propositions théoriques et des
implémentations à grande échelle les plus récentes.
Le chapitre 7, rédigé par Patrice Bellot, reprend certains thèmes développés au
chapitre 5 en considérant la question de l’estimation automatique de la difficulté de
lecture d’un texte en adéquation avec la prise en compte d’un handicap langagier
courant : la dyslexie. Il concerne ainsi l’adaptation de la recherche d’information
pour des utilisateurs aux capacités de lecture limitées (personnes présentant des
pathologies langagières, ne maîtrisant pas suffisamment la langue d’un texte ou
n’ayant pas l’expertise nécessaire à sa compréhension). Ce chapitre discute tout
d’abord de la modélisation cognitive de la lecture en présentant quelques modèles
connexionnistes puis énumère les nombreux critères qui peuvent être pris en compte
pour estimer la difficulté de lecture d’un texte. Les principales mesures de lisibilité
proposées dans la littérature depuis une cinquantaine d’années sont présentées
en portant un regard particulier sur celles, actuelles, qui sont estimées
automatiquement. La suite du chapitre est consacrée à l’expérimentation de fonctions de
recherche d’information prenant en compte une mesure de lisibilité dans un contexte
général puis spécifique à la dyslexie comme trouble du langage dont différentes
variantes sont décrites.
La troisième partie du livre traite de l’assistance aux utilisateurs, d’aide à la
navigation et d’interfaces spécifiques.
Le chapitre 8, écrit par Benoit Favre, discute de l’aide à la navigation dans
des documents audio. L’auteur revient sur les principales méthodes de RI appliquées
à la recherche d’information parlée avant d’aborder les techniques de résumé
automatique. Il détaille les approches avérées les plus efficaces lors des campagnes
d’évaluation organisées par le NIST (TREC et TAC) ces dernières années. La suite
du chapitre concerne les interfaces de navigation à proprement parler, selon deux
22 RI contextuelle, assistée et personnalisée
axes : la navigation au sein d’un document et la navigation à l’intérieur d’une
collection de documents. L’exploration peut être réalisée sur le signal même de
l’enregistrement audio, sur sa transcription textuelle intégrale ou sur son résumé.
Une interface combinant exploration globale par frise chronologique et navigation
locale par aller-retour entre le résumé et l’enregistrement sonore est proposée.
Le chapitre 9, rédigé par Mountaz Hascoet concerne l’interaction pour la
recherche d’information en se concentrant sur les techniques de visualisation
interactive. Ce chapitre commence par analyser les besoins d’interactivité en RI en
fonction des tâches envisageables. Différentes catégories d’interaction sont
présentées qui différencient par exemple la sélection d’informations intéressantes de
l’exploration globale et de la mise en relation de documents. Les principales
méthodes d’interaction font l’objet de la suite du chapitre : interaction à facettes,
filtrage dynamique, brossage, interfaces zoomables ou déformables et, enfin,
interaction distribuée.
Le chapitre 10, écrit par Jean-Yves Antoine, traite des liens entre recherche
d’information et l’informatique ubiquitaire (ou ambiante) par l’intermédiaire des
dispositifs mobiles d’aide à la formulation des requêtes. Il constitue en quelque sorte
une synthèse des grands thèmes abordés dans cet ouvrage puisqu’y apparaissent les
questions de prise en compte du contexte de la recherche, du profil des utilisateurs,
des interfaces homme-machine et des approches en modélisation de la langue. La
première section du chapitre présente des dispositifs d’entrée à l’interface limitée et
introduit la problématique de la prédiction de mots désormais courante sur les
dispositifs mobiles tels que les Smartphones et autres liseuses pourvues de clavier
virtuel sur écran tactile. Une place toute particulière est donnée aux dispositifs
d’entrée pour personnes aux capacités motrices réduites (infirmités motrices,
myopathies, scléroses amyotrophiques...) mettant en œuvre interfaces logicielles ou
matérielles adaptées. L’évaluation de la prédiction de mots pour la saisie de
messages est alors abordée avant de présenter quelques-uns des principaux modèles
adaptatifs faisant intervenir modélisation de l’utilisateur et contexte sémantique.
Bibliographie
[BAE 99] BAEZA-YATES R., Modern Information Retrieval, ACM Press, Addison-Wesley,
1999.
[BEL 08a] BELKIN N.J., « Some(what) grand challenges for information retrieval », SIGIR
Forum, vol. 42, n° 1, p. 47-54, 2008.
[BEL 08b] BELLOT P., BOUGHANEM M., « Recherche d’informations et question-réponse »,
dans Grau B. et Chevallet J.-P (dir.), La recherche d’informations précises, p. 31-68,
Hermès, Paris, 2008. Introduction 23
[BLA 00] BLACHE P., « Le rôle des contraintes dans les théories linguistiques et leur intérêt
pour l’analyse automatique : les Grammaires de Propriétés », TALN 2000, Lausanne,
Suisse, 2000.
[BLA 03] BLACHE P., « Vers une théorie cognitive de la langue basée sur les contraintes »,
TALN 2003, Batz-sur-Mer, France, 2003.
[BOO 83] BOOKSTEIN A., « Information retrieval : A sequential learning process », Journal of
the American Society for Information Science, 1983.
[BOU 04] BOUGHANEM M., KRAAIJ W., NIE J.Y., « Modèles de langue pour la recherche
d’information », dans Ihadjadene M. (dir.), Les systèmes de recherche d’informations,
p. 163182, Hermès, Paris, 2004.
[CHO 64] CHOMSKY N., « Current issues in Linguistic Theory », dans Fodor J. et Katz B.
(dir.), The structure of language, Prentice Hall, New York, 1964.
[CHO 81] CHOMSKY N., Lectures in Government and Binding, Foris Publications, Dordrecht,
1981.
[DEE 90] DEERWESTER S., DUMAIS S., LANDAUER T., FURNAS G., HARSHMAN R., « Indexing
by Latent Semantic Analysis », Journal of the American Society of Information Science,
vol. 41, n° 6, p. 391-407, 1990.
[DEH 07] DEHAENE S., Les neurones de la lecture, Odile Jacob, Paris, 2007.
[EDE 07] EDELMAN G., La science du cerveau et de la connaissance, Odile Jacob, Paris,
2007.
[GRO 07] GRODZINSKY Y., « La syntaxe générative dans le cerveau », dans Bricmont J. et
Franck J. (dir.), Chomsky (Les Cahiers de l’Herne), Editions de l’Herne, Paris, 2007.
[HAR 93] HARTH E., The creative loop : how the brain makes a mind, Addison-Wesley,
New York, 1993.
[JAK 07] JAKUBOWICZ C., « Grammaire universelle et Trouble Spécifique du Langage », dans
Bricmont J. et Franck J. (dir.), Chomsky (Les Cahiers de l’Herne), Editions de l’Herne,
Paris, 2007.
[KWO 95] KWOK K.L., « A network approach to probabilistic information retrieval »,
ACM Trans. Inf. Syst., vol. 13, n° 3, p. 324-353, 1995.
[MUN 97] MUNOS R., L’apprentissage par renforcement, étude du cas continu, Thèse de
doctorat, Ecole des hautes études en sciences sociales, 1997.
[PON98] PONTE J.M., CROFT W.B., «A Language Modeling Approach to Information
Retrieval », Proceedings of the 21st annual international ACM SIGIR conference on
Research and development in information retrieval, Melbourne, Australie, ACM Press,
p. 275-281, 1998.
[RIZ 08] RIZZOLATTI G., SINIGAGLIA C., Les neurones miroirs, Odile Jacob (pour la
traduction française), Paris, 2008.
24 RI contextuelle, assistée et personnalisée
[ROB 76] ROBERTSON S., SPARCK-JONES K., « Relevance weighting of search terms »,
Journal of the American Society for Information Science, vol. 27, n° 3, p. 129-146, 1976.
[SAB 96] SABBAH G., « Le “carnet d’esquisses” : une mémoire interprétative dynamique »,
RFIA, p. 1096-1105, 1996.
[SAB 99] SABBAH G., POPESCU-BELIS A., « Experiments in language acquisition by artificial
systems », MIND-4, Dublin, p. 1-10, 1999.
[SAB06] SABBAH G., « Compréhension automatique des langues : où va-t-on ? Où
pourraiton aller ? », dans Sabbah G. (dir.), Compréhension des langues et interaction, Hermès,
Paris, 2006.
[SAL 83] SALTON G., FOX E., WU H., « Extended boolean information retrieval »,
Communications of the ACM, vol. 31, n° 2, p. 1002-1036, 1983.
[SAV03] SAVOY J., « Modèles en recherche d’information », dans Gaussier E. et Stéfanini
M.H. (dir.), Assistance intelligente à la recherche d’informations, p. 31-70, Hermès,
Paris, 2003. PREMIÈRE PARTIE
ContexteetrobustesseChapitre 1
Recherche d’information contextuelle :
le cas des requêtes
1.1. Introduction
Les systèmes de recherche d’information (RI) actuels sont souvent généralistes :
ils mettent en œuvre les mêmes mécanismes et les mêmes méthodes de traitement de
l’information, quels que soient le contexte de recherche, l’utilisateur, son type de
besoin d’information et l’usage qu’il souhaite faire de l’information retrouvée.
La RI contextuelle vise à modéliser les différents aspects du contexte et leur
variété pour les intégrer dans le processus de recherche. L’aspect contextuel fait
référence à des connaissances implicites ou explicites concernant les intentions de
l’utilisateur, l’environnement de l’utilisateur et le système lui-même. L’hypothèse
est que rendre explicites certains éléments du contexte de la RI pourrait améliorer les
performances des systèmes de RI.
Comme le souligne le rapport [ALL 03], « malgré un intérêt récent pour
ces problématiques, peu de progrès ont été faits à cause de la difficulté d’extraire
et de représenter la connaissance concernant les utilisateurs, le contexte et les
tâches. […]. Les systèmes du futur devront être capables d’utiliser le contexte et
les caractéristiques des requêtes pour inférer des caractéristiques sur le besoin
d’information comme le type de requête, le type de réponse, le niveau de réponse et
d’utiliser ces caractéristiques dans les modèles de recherche […] ».

Chapitre rédigé par Josiane MOTHE. 28 RI contextuelle, assistée et personnalisée
En effet, un système de RI a pour but de satisfaire des besoins d’information.
La satisfaction de l’utilisateur par rapport aux réponses d’un système de RI dépend
de l’objectif de l’utilisateur et de l’usage qu’il souhaite faire de l’information :
veutil vérifier une hypothèse ? Connaître la réponse à une question précise ou réaliser
une étude par rapport à un domaine ? En fonction de ses objectifs, l’utilisateur
souhaitera un plus ou moins grand nombre de documents en réponse à sa requête.
Un seul document peut servir à répondre à une question précise ; en revanche pour
une étude, un plus grand nombre de documents sera attendu. La redondance dans les
réponses peut correspondre à un besoin de vérification d’une information ou au
contraire à un bruit, en fonction du contexte de la recherche. La notion même de
l’unité d’information la plus adaptée à un besoin peut varier : un rapport, une page,
une partie de document ou même une phrase, un mot ou un chiffre peuvent
permettre de satisfaire l’utilisateur dans sa recherche.
L’étude du contexte repose sur plusieurs fondements [MAN 03]. Dans la
communication, le contexte permet d’une part d’appréhender le sens donné aux
mots, puisque celui-ci dépend par exemple des disciplines, des langages de
communauté, etc. D’autre part, le contexte délimite l’action. Les pratiques et les
modèles de comportement sont difficilement détectables si l’on considère
l’ensemble des individus, mais sont plus faciles à détecter si l’on s’intéresse à un
groupe restreint et identifié. Ces deux aspects sont fondamentaux en RI.
Freund et Toms [FRE 05] soulignent que les cinq dimensions de la pertinence en
RI définies par [SAR 96], à savoir thématique, système, de situation, cognitive et
affective sont fortement liées à la notion de contexte. Cette notion de contexte
recouvre différents aspects comme le soulignent [ING 05] (voir figure 1.1).

Figure 1.1. Modèle analytique général de la recherche d’information [ING 05]
Dans la figure 1.1, les objets correspondent aux éléments que peut restituer
un système de RI ; ces objets peuvent être d’une grande variabilité. Le système