Méthodes avancées pour les systèmes de recherche d informations
250 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Méthodes avancées pour les systèmes de recherche d'informations , livre ebook

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
250 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

L'ouvrage concerne l'une des évolutions des plus importantes depuis une décennie : la possibilité d'accéder à des parties d'un document à travers sa structure et de pouvoir y naviguer intelligemment. Cet ouvrage aborde certaines fonctionnalités avancées e


Navigation et recherche dans un système hypertexte -I. Saleh, F. Papy. Recherche d'informations dans des documents XML -J. Le Maître, E. Murisasco, E. Bruno. Langages de méta-données pour Web(s) sémantique(s) -H. Folch, B. Habert. Classification de documents et enrichissement de requêtes -P. Bellot. Visualisation d'information et interaction -M. Hascoët. Les SRI multilingues -C. Fluhr. Filtrage d'information -M. Boughanem, M. Tmar, H. Tebri. Recherche d'informations sur le web -J. Savoy. Les systèmes de question-réponse -B. Grau. Les outils de veille et d'intelligence économique -L. Favier, M. Ihadjadene. Index.

Sujets

Informations

Publié par
Date de parution 01 mars 2004
Nombre de lectures 68
EAN13 9782746227026
Licence : Tous droits réservés
Langue Français

Informations légales : prix de location à la page 0,4400€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Extrait

Introduction
Offrir un accès intelligent aux ressources d’information et de connaissances constitue un véritable défi pour les entreprises et les organisations. Cet ouvrage a pour vocation de faire un état de l’art des méthodes et des fonctionnalités avancées indispensables à tout accès intelligent et personnalisé à l’information. Au-delà de la recherche par mot-clé largement répandue dans les moteurs de recherches actuels, il s’agit de mettre au point des systèmes de recherche d’informations performants avec la prise en compte du concept de profil, l’intégration de possibilités d’interrogation multilingue, de la navigation et des techniques récentes en visualisation de l’information.
Le premier chapitre se propose de caractériser les différents modes de navigation hypertextuelle. Les auteurs montrent que la navigation et l’interrogation représentent deux approches complémentaires pour retrouver des informations. La navigation permet une exploration libre et informelle d’un espace d’information et l’interrogation donne un accès formel et analytique par la formulation de requêtes descriptives. Dans le cas du web, le mécanisme de recherche d’informations par navigation consiste à se déplacer d’une page web à une autre, par décision à chaque étape du lien à suivre parmi un ensemble de liens possibles. Cette navigation nécessite une assistance. L’une des approches proposées dans la littérature pour la conception des systèmes d’aide au choix de liens, et plus généralement pour le calcul de recommandation, est la réutilisation des navigations passées d’un groupe d’utilisateurs dont les comportements sont observés suivant un ensemble de variables.
Dans le deuxième chapitre, les auteurs rappellent à juste titre que la structure des documents n’est prise en compte ni au niveau de la requête pour exprimer des proximités structurelles, ni au niveau de la réponse pour ne retourner que les parties Introduction rédigée par Madjid IHADJADENE.
16 Méthodes avancées pour les SRI
des documents pertinentes vis-à-vis de la requête. Or, la structure du texte est un aspect essentiel dans la recherche d’information. Le but de ce chapitre est donc de montrer l’intérêt des langages XPath et XQuery pour la recherche d’information dans des documents décrits en XML. Les auteurs montrent que le langage XPath peut être utilisé comme un langage d’interrogation booléen étendu dont les termes sont préfixés par leur localisation plus ou moins précise dans le document et que le langage XQuery peut l’être pour construire une réponse précise et ordonnée.
A l’inverse des outils de navigation traditionnels (index, références bibliographiques, renvois, glossaires, thésaurus, tables des matières), les Topics Maps et RDF (Resource Description Framework) fournissent un modèle de description des métadonnées en vue de faciliter l’accès sémantique à des ressources. Les langages de métadonnées RDF et Topic Maps sont l’objet du troisième chapitre. Ils contribuent, avec un langage ontologique partageable (OWL) et des traitements inférentiels, à l’objectif global d’un Web Sémantique : adjoindre aux contenus informels actuels du Web des connaissances formalisées qui puissent être utilisées et/ou produites par des traitements automatiques. Les auteurs mettent en évidence, en contrastant RDF et Topic Maps, la complémentarité d’une démarche formalisante poussée et de représentations semi-structurées laissant une place centrale à la qualification humaine des informations.
Le paradoxe de la recherche documentaire vient de ce que l’usager doit décrire l’information qu’il n’a pas. Il est plus facile aux usagers de découvrir ou de repérer quelque chose qui peut les intéresser, que de produire des descriptions formelles. Plusieurs travaux de recherche ont montré que les stratégies de présentation de l’information conditionnent les performances de recherche des usagers.
La quatrième contribution est relative à la classification et à la reformulation des requêtes. Après une introduction sur les objectifs et les applications possibles de la classification, l’auteur présente les techniques et algorithmes de classification ou catégorisation automatiques. La première approche consiste à proposer à l’utilisateur les documents ayant des mots en commun avec la requête et, les documents appartenant aux mêmes classes. Cette utilisation des techniques de classification permet notamment de proposer des documents qui ne contiennent pas de mots communs avec la requête. La seconde consiste à classer les documents trouvés de manière à faire émerger l’ensemble des documents pertinents. Un des objectifs peut être aussi de classer les documents en fonction de leurs références communes à d’autres documents pour faire apparaître les liens qui les unissent. La recherche documentaire est un processus interactif qui se présente comme une suite de formulations et de reformulations de requêtes jusqu’à la satisfaction des besoins d’information. La requête initiale permet rarement d’aboutir à un résultat qui réponde entièrement à l’attente de l’usager. L’auteur traite également dans ce quatrième chapitre des techniques d’enrichissement ou de reformulation de requêtes.
Introduction 17
Il existe actuellement sur le marché des moteurs de recherche cartographique de type Kartoo ou Mapstan qui représentent les résultats d’une recherche sous forme d’une carte dynamique. Néanmoins, ces outils de cartographie n’exploitent pas toute la richesse des travaux de recherche en visualisation d’information. Le cinquième chapitre présente une typologie des techniques de visualisation (données multidimensionnelles, arbres, graphes, cartes interactives dynamiques, etc.). L’auteur rappelle que le but de la visualisation d’information est d’exploiter les caractéristiques du système visuel humain pour faciliter la manipulation et l’interprétation de données informatiques variées. L’essor qu’a connu le domaine de la visualisation interactive d’information depuis plus de dix ans a conduit à l’émergence d’alternatives au modèle classique des interfaces graphiques dites WIMP. Le but de ce chapitre est de donner un aperçu de ces alternatives tant en termes de visualisation que d’interaction.
Le multilinguisme est une composante importante d’Internet. La recherche d’information multilingue vise à fournir des outils pour permettre aux usagers de trouver des documents dans une langue différente de la langue de requête. La conception d’un système multilingue demande une connaissance approfondie des différents mécanismes linguistiques que l’on peut rencontrer dans les différentes langues abordées. Le sixième chapitre vise à faire le point sur les technologies des systèmes de recherche d’informations multilingues et interlingues. Pour l’auteur, l’approche à base de dictionnaires bilingues est potentiellement la plus performante par rapport aux méthodes statistiques. Cette approche demande une qualité des ressources qui s’acquière peu à peu avec la production des premiers produits industriels.
Dans le septième chapitre, les auteurs exposent la problématique générale de la personnalisation des systèmes d’accès à l’information et se focalisent ensuite sur la conception d’algorithmes pour le filtrage d’information.
Les systèmes de recherche d’informations concernent plusieurs domaines : les applications classiques (GED, archives, bibliothèques et serveurs d’information), les bibliothèques numériques, la gestion de contenus (content record management), le Record management, la veille et la gestion des connaissances. Ces applications font l’objet de plusieurs publications. Dans cet ouvrage, les auteurs présentent trois types d’applications pour l’accès à l’information sur Internet : les systèmes de questions-réponses, les moteurs de recherche et les outils de veille.
Dans le huitième chapitre, l’auteur explique les principes et le fonctionnement des moteurs de recherche. Il met en lumière les différences essentielles entre le Web et un fonds documentaire traditionnel, puis il présente le fonctionnement des moteurs de première et de deuxième générations. Les premiers s’appuient uniquement sur le contenu des pages. Les seconds ont recours aux hyperliens (à
18 Méthodes avancées pour les SRI
l’exemple de l’algorithmePageRank) afin d’améliorer le dépistage de l’information. L’auteur expose quelques stratégies de dépistage spécifique pour répondre à d’autres types de requête.
Dans le neuvième chapitre, l’auteur met en évidence les problèmes posés par les systèmes de questions-réponses. Dans le cas d’un besoin précis d’information, qui peut s’exprimer en une question, il est intéressant de partir d’une question factuelle ordinaire et de fournir en résultat la réponse attendue, et non un document. Après un bref rappel historique, l’auteur décrit en détail le fonctionnement d’un tel système et rappelle à juste titre que la conception d’un système de question-réponse ne doit pas être unique, mais doit dépendre de l’application dans laquelle il intervient.
La veille est une application particulière de la recherche d’information reposant à la fois sur les outils les plus élaborés de la recherche d’information et sur une organisation humaine capable de les utiliser de manière systématique à des fins d’aide à la décision. Un marché des outils de veille s’est constitué et développé à mesure que l’intelligence économique est considérée par les uns et les autres comme une arme stratégique. Les auteurs, dans le dixième chapitre, présentent une étude révélant les principales fonctionnalités de ces technologies en France et aux Etats-Unis ainsi que leur utilisation effective en France à partir d’une enquête sur un échantillon d’entreprises pratiquant la veille.
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents