La lecture à portée de main
Découvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDécouvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDescription
Sujets
Informations
Publié par | Hermès - Editions Lavoisier |
Date de parution | 14 septembre 2011 |
Nombre de lectures | 16 |
EAN13 | 9782746241862 |
Langue | Français |
Poids de l'ouvrage | 6 Mo |
Informations légales : prix de location à la page 0,0592€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.
Extrait
Recherche d’information contextuelle, assistée et personnalisée
© LAVOISIER, 2011
LAVOISIER
11, rue Lavoisier
75008 Paris
www.hermes-science.com
www.lavoisier.fr
ISBN 978-2-7462-2583-1
ISSN 1968-8008
Le Code de la propriété intellectuelle n'autorisant, aux termes de l'article L. 122-5, d'une part,
que les "copies ou reproductions strictement réservées à l'usage privé du copiste et non
destinées à une utilisation collective" et, d'autre part, que les analyses et les courtes citations
dans un but d'exemple et d'illustration, "toute représentation ou reproduction intégrale, ou
partielle, faite sans le consentement de l'auteur ou de ses ayants droit ou ayants cause, est
illicite" (article L. 122-4). Cette représentation ou reproduction, par quelque procédé que ce
soit, constituerait donc une contrefaçon sanctionnée par les articles L. 335-2 et suivants du
Code de la propriété intellectuelle.
Tous les noms de sociétés ou de produits cités dans cet ouvrage sont utilisés à des fins
d’identification et sont des marques de leurs détenteurs respectifs.
Printed and bound by CPI Group (UK) Ltd, Croydon, CR0 4YY, September 2011
Recherche d’information
contextuelle, assistée
et personnalisée
sous la direction de
Patrice Bellot
Direction éditoriale Jean-Charles Pomerol
COLLECTION RECHERCHE D’INFORMATION ET WEB
SOUS LA DIRECTION DE BERNADETTE BOUCHON-MEUNIER
Résumé automatique de documents – Juan-Manuel Torres-Moreno, 2011
Modèles statistiques pour l’accès à l'information textuelle – Eric Gaussier et
François Yvon, 2011
Sémantique et multimodalité en analyse de l'information – Marine Campedel et
Pierre Hoogstoel, 2011
Recherche d’information : état des lieux et perspectives – Mohand Boughanem
Mohand et Jacques Savoy, 2008
Liste des auteurs
Jean-Yves ANTOINE Benoit FAVRE
LI – Lab-STICC LIF
Université François Rabelais/CNRS Université d’Aix-Marseille/CNRS
Tours Marseille
Patrice BELLOT Olivier GALIBERT
LSIS LIMSI
Université d’Aix-Marseille/CNRS Université Paris Sud/CNRS
Orsay
Philippe BLACHE
LPL Mountaz HASCOËT
Université d’Aix-Marseille/CNRS LIRMM
Université Montpellier II/CNRS
Guillaume CABANAC
IRIT Gilles HUBERT
Université Paul Sabatier/CNRS IRIT
Toulouse Université Paul Sabatier/CNRS
Toulouse
Max CHEVALIER
IRIT Christine JULIEN
Université Paul Sabatier/CNRS IRIT
Toulouse Université Paul Sabatier/CNRS
Toulouse
Alexandra CIACCIA
PPCC Lori LAMEL
Université Paris Ouest Nanterre LIMSI
La Défense Université Paris Sud/CNRS
Orsay
Céline CLAVEL
LIMSI Josiane MOTHE
Université Paris Sud/CNRS IRIT
Orsay Université Paul Sabatier/CNRS
Toulouse
Nathalie DENOS
LIG Stéphane RAUZY
Université Joseph Fourier/CNRS LPL
Grenoble Université d’Aix-Marseille/CNRS
Sophie ROSSET Chantal SOULÉ-DUPUY
LIMSI IRIT
Université Paris Sud/CNRS Université Toulouse 1 Capitole/CNRS
Orsay
André TRICOT
Laurianne SITBON CLLE-LTC
NICTA/QUT Université Toulouse Le Mirail/CNRS
Queensland University of
Technology
Brisbane
Australie
Table des matières
Introduction........................................ 15
PREMIÈRE PARTIE. CONTEXTE ET ROBUSTESSE.................. 25
Chapitre 1. Recherche d’information contextuelle :
le cas des requêtes.................................... 27
Josiane MOTHE
1.1. Introduction 27
1.2. Types de requêtes ................................ 29
1.2.1. Requêtes populaires ou répétées .................... 30
1.2.2. Requêtes reformulées et historique des requêtes........... 33
1.2.3. Requêtes difficiles ............................ 35
1.2.3.1. Variabilité des systèmes...................... 35
1.2.3.2. Prédiction de la difficulté d’une recherche ........... 37
1.3. Classification de requêtes ........................... 39
1.3.1. Classification thématique ........................ 40
1.3.2. Classification de requêtes basée sur leurs caractéristiques ..... 42
1.3.3. Classer les requêtes selon leurs performances ............ 42
1.4. Adapter les traitements aux requêtes ..................... 44
1.4.1. Variabilité et fusion de systèmes comme point de départ ..... 44
1.4.2. Choisir les traitements en fonction des requêtes ........... 45
1.4.3. Choisir le meilleur moteur pour chaque requête 45
1.4.3.1. Choix du meilleur système pour chaque besoin
d’information................................. 46
1.4.3.2. Performance en fonction du groupe
de besoin d’information ........................... 46
8 RI contextuelle, assistée et personnalisée
1.5. Conclusion .................................... 48
1.6. Bibliographie ................................... 50
Chapitre 2. Robustesse et analyse syntaxique................... 57
Philippe BLACHE et Stéphane RAUZY
2.1. Introduction 57
2.2. Les situations 58
2.3. Le cas de la recherche d’information..................... 60
2.4. Les techniques .................................. 60
2.4.1. Etiquetage et désambiguisation 61
2.4.2. Analyse syntaxique ............................ 62
2.4.2.1. Analyse syntaxique superficielle symbolique ......... 63
2.4.3. Analyse syntaxique superficielle stochastique ............ 64
2.4.4. Bilan..................................... 65
2.5. Une approche syntaxique intrinsèquement robuste :
les Grammaires de Propriétés ........................... 66
2.5.1. Les caractéristiques des Grammaires de Propriétés......... 66
2.5.2. Les mécanismes d’analyse en GP ................... 67
2.6. Conclusion .................................... 69
2.7. Bibiographie ................................... 70
Chapitre 3. La recherche d’information face à des corpus
et requêtes bruités 73
Laurianne SITBON
3.1. Introduction.................................... 73
3.2. Les bruits de l’information ........................... 74
3.2.1. Les erreurs de pré-traitement ...................... 75
3.2.1.1. Requêtes et corpus audio ..................... 75
3.2.1.2. Requêtes translingues ....................... 75
3.2.1.3. Corpus manuscrits ......................... 76
3.2.2. Les erreurs de l’utilisateur........................ 76
3.2.2.1. Les échecs de la dictée 76
3.2.2.2. Les handicaps de langage 77
3.2.2.3. Les erreurs volontaires 77
3.2.3. L’évolution des langues......................... 77
3.3. L’impact du bruit sur l’efficacité des systèmes
de recherche d’information ............................. 78
3.3.1. Campagnes d’évaluation......................... 78
Table des matières 9
3.3.2. Evaluation de la recherche documentaire
avec des données bruitées ............................ 79
3.4. Evaluation détaillée d’un système de questions-réponses
face à des requêtes non standards ......................... 80
3.4.1. Sélection des requêtes .......................... 80
3.4.2. Collecte des requêtes ........................... 81
3.4.3. Analyse des échecs de SQuALIA ................... 82
3.4.3.1. Analyse de la question....................... 83
3.4.3.2. Sélection des passages et des réponses ............. 84
3.4.3.3. Résultats finaux 85
3.5. Systèmes de recherche documentaire robustes au bruit .......... 85
3.5.1. Modélisation des erreurs et entraînement des systèmes
en conditions bruitées .............................. 86
3.5.2. Prise en compte de l’incertitude – Utilisation de scores
de confiance .................................... 86
3.5.3. Utilisation de modèles thématiques .................. 88
3.6. Prise en compte de solutions multiples pour la réécriture
de questions ...................................... 88
3.6.1. Approche grapho-phonémique à la réécriture de questions .... 88
3.6.2. Modèle probabiliste pour la prise en compte de l’incertitude
dans les SRI complexes ............................. 90
3.6.3. Evaluation du pré-traitement en vue d’une utilisation
avec un modèle basé sur l’incertitude ..................... 92
3.7. Conclusion 95
3.8. Bibliographie ................................... 96
Chapitre 4. Questions-réponses sur des documents audio........... 99
Olivier GALIBERT, Sophie ROSSET et Lori LAMEL
4.1. Introduction.................................... 99
4.2. Campagnes d’évaluation ............................ 101
4.2.1. Les documents............................... 102
4.2.2. Les questions 103
4.2.3. Les métriques 105
4.3. Systèmes de questions-réponses sur de la parole .............. 105
4.3.1. Systèmes de questions-réponses .................... 106
4.3.2. Traiter la parole .............................. 108
4.3.3. Approches utilisées dans QAst ..................... 109
4.3.3.1. Analyse des documents ...................... 110
4.3.3.2. Recherche d’information 112
10 RI contextuelle, assistée et personnalisée
4.3.4. Résultats .................................. 113
4.3.4.1. Résultats globaux.......................... 113
4.3.4.2. Discussions ............................. 115
4.4. Conclusions et perspectives 120
4.5. Bibliographie ................................... 121
DEUXIÈME PARTIE. PERSONNALISATION ET COLLABORATION ......... 125
Chapitre 5. Recherche d’information et modélisation usagers ........ 127
Guillaume CABANAC, Max CHEVALIER, Alexandra CIACCIA, Céline CLAVEL,
Christine JULIEN, Gilles HUBERT, Chantal SOULÉ-DUPUY et André TRICOT
5.1. Introduction.................................... 127
5.2. Modélisation informatique des usagers dans les SRI ........... 128
5.2.1. Dimensions de l’usager exploitées par les SRI
pour la personnalisation ............................. 129
5.2.2. Sources privilégiées pour la collecte d’informations
pour la modélisation usager ....................