Cette publication est accessible gratuitement
Télécharger

Vous aimerez aussi

LES OUTILS DU WEB ET LES RESSORTS DU WEB 2.O
1
Sommaire
Introduction................................................................................................3
I-Moteurs et méta-moteurs de recherche.................................................4  A-Google Scholar...............................................................4  B-Scirus..............................................................................7  C-Copernic.........................................................................9  D-OAIster.........................................................................11
II-Gestion des flux RSS............................................................................14  A-Firefox comme lecteur de flux RSS............................14  B-Gestion des fils RSS avec Sage...................................15
III-La gestion et le partage de liens : le social bookmarking................18  A-Présentation et installation de Del.icio.us.................18  B-Gestion et alimentation de Del.icio.us.......................19
Glossaire....................................................................................................29
2
Introduction
L’expression «Web 2.0» est née en 2004, chez l’éditeur de livres d’informatique O’Reilly, des réflexions de Dale Dougherty sur la renaissance du Web à la suite de la crevaison de la bulle Internet, au début du millénaire. Le Web 2.0 se caractérise par un changement de logique : les usagers deviennent à présent les premiers responsables du contenu et Internet remplace l’ordinateur personnel comme plateforme. Si le web 2.0 repose sur une interaction poussée entre les utilisateurs à travers l'essor du crowdsourcing (littéralement « approvisionnement par la foule », consistant à utiliser la créativité, l'intelligence et le savoir-faire d'un grand nombre d'internautes, et ce, au moindre coût), il développe également un certain nombre de nouveaux outils : méta-moteurs de recherche, outils de syndication, étiquetage. Ces récents développements tendent à faire d'Internet l'élément incontournable d'un travail de recherche de plus en plus hétérogène. Un doctorant peut en effet profiter des outils du Web 2.0 sans créer lui-même et partager du contenu, en se servant des fils RSS pour demeurer informé de tout ce qu’il juge pertinent à son enseignement et en classant les sites Internet qui l’intéressent particulièrement selon ses propres mots-clés (étiquettes ou tags). Il peut effectuer cette veille grâce à des outils en ligne, de chez lui ou à partir de n’importe quel ordinateur connecté au réseau Internet. Ainsi, ses signets se retrouveront, par exemple, sur son compte Del.icio.us, et ses fils RSS, sur son agrégateur personnel hébergé par Newsgator Online ou Google Reader. De plus, le web 2.O modifie drastiquement les modalités de conception et les conditions de diffusion du travail scientifique. L’avènement du Web 2.0 dans son versant relationnel peut aider les doctorants dans leur tâche en donnant lieu à des usages collaboratifs liés à des communautés de pratique. Par exemple, un doctorant en physique pourra lancer un blog destiné à ses collègues de laboratoire, ayant pour but de partager outils, réflexions et conseils. L'essor des archives ouvertes (HAL, TEL) donne au travail universitaire une nouvelle forme en l'inscrivant dans une logique de partage universaliste. Sites Web 2.0Veille pouvant servir aux doctorants Google Docs WikipediaX YouTube Del.icio.usX TechnoratiX Flickr DiggX SlideShare Slide
Conception  PrésentationMédiatisation et egasstienprAp édition X X X X X
X X X
X X X
X
Pour créer des textes et des feuilles de calcul. Comme une encyclopédie qu’il faut critiquer. Pour réaliser et partager une présentation vidéo Pour classer vos signets d’une nouvelle manière. Pour fouiller blogues et fils RSS. Toute un groupe peut commenter des images. Pour une veille… en anglais. Pour placer en ligne les présentations Powerpoint. Pour réaliser des diaporamas dynamiques.
3
Avec ce guide, nous vous proposons d'évoquer les développements du web 2.0 les plus utiles au travail de thèse. A ce titre, nous verrons comment exploiter avec pertinence les moteurs et méta-moteurs de recherche. Nous montrerons également l'usage qui peut être fait des fils de syndication RSS. La dernière partie de ce document sera consacrée au maniement des outils de gestion et de partage de liens.
I-Moteurs et Méta-moteurs de recherche
A-Google Scholar
Google Scholarest un moteur de recherche spécialisé dans la littérature de recherche universitaire : il indexe desarticlesissus de périodiques avec évaluation par les pairs (peer reviewed), des thèses, des livres, des articles en pré-publication, des rapports. Ces documents proviennent d'éditeurs scientifiques, de sociétés savantes, de répertoires de pre-prints, de serveurs universitaires. Fin 2007, Google Scholar a lancé la numérisation de revues obtenues auprès de petits éditeurs et de sociétés savantes de langues autres qu'anglaises et ouest-européennes. Google Scholar permet ainsi de retrouver les documents du « web invisible » indisponibles sur les moteurs de recherche généralistes. Google Scholar se positionne en rival aux offres commerciales de bases de données et collections de journaux électroniques. Si la qualité des résultats des recherches n’atteint pas celle des produits précédents, la simplicité d’utilisation est un avantage important. Domaines couvertsmais les ressources en sciences exactes et: base de données multidisciplinaire, médicales sont mieux couvertes que les sciences humaines et sociales. Langue: majoritairement en anglais. Volume :inconnu. Période couverte: inconnue. Mise à jour :inconnue. Pour la France, Google Scholar prend en compte la totalité de l’archive française HAL du CCSD et les collections du fonds documentaire de l'INIST. Google scholar a conclu un accord avec Elsevier aux termes duquel le moteur de recherche a pu indexer le contenu de ScienceDirect. Il faut interroger dans la langue recherchée. Google Scholar propose deux interfaces : Recherche simple : A utiliser pour une recherche sur un ou plusieurs termes : opérateur ET implicite, pas de troncature. Guillemets pour rechercher une expression : « Philosophie Lumière » Voltaire Recherche avancée : on dispose • de champs qui remplissent les fonctions des opérateurs booléens AND, NOT, OR et de la recherche d’une expression stricte avec guillemets • de champs qui proposent de rechercher par auteur, nom de publication et intervalle de dates • de la recherche du terme dans tout le document ou limitée au titre • de la limite à un ou plusieurs domaine(s) parmi sept
4
Conseils de recherche : La recherche se fait dans le texte intégral en langage naturel. Il faut donc penser aux synonymes, en particulier en utilisant les termes scientifiques :      ͢ en évitant les sigles et en précisant la recherche. Pour cela utilisez la « Recherche avancée » ou les préfixes : • author: • intitle: limite la recherche aux termes du titre • site: exemple site: blackwell-synergy.com • URL: • journal: attention les noms de journaux sont en entier ou abrégés • Date (année sur 4 chiffres) • Subject areas : 7 grands domaines disciplinaires (uniquement pour l’interface en anglais) Le lien Scholar Preferences permet de personnaliser certaines options du moteur : Langue de l’interface : quatorze langues dont le français Langue de recherche : 8 langues dont le français, par défaut pas de limite de langue • Exportation de références vers un logiciel de gestion : BibTex, EndNote, RefManger, RefWorks
La page de résultats affiche le titre du document trouvé, l’auteur du document proposé ainsi que le nombre de liens pointant vers le fichier, les différentes sources où il est disponible ainsi que les versions successives existant sur le Web.    Auteur
Revue
Extrait de texte
Date de publication
5
Mentions éventuelles : [CITATION]suivi de la mentionCited by x: il s'agit d'une citation dans un article, en cliquant sur Cited by x vous trouvez les x référencescitantesde l'article en question. [BOOK]sont pas en général disponibles en ligne en texte intégralsignale un livre. Les livres ne actuellement. Un lien permet de localiser une bibliothèque le possédant. -Cited by ..donne les articles citant dans la base de Google Scholar
Élargissement de la recherche, plusieurs possibilités : -Related articles(articles proches) : Google Scholar détermine les articles de sa base de données les plus voisins dans leur sujet de celui affiché. Aucune information sur la méthode utilisée.  Web Searchd’une requête constituée du 1er auteur ou(toujours présent) : relance dans Google -terme du journal et mot(s) significatif(s) du titre : ex"Ahuja" "* assessment * *" - Library Searchpour localiser un livre avec WorldCat de l’OCLCcat.inist.fr.Un lien vers la référence bibliographique ainsi que vers le service de commande de copies de documents est inséré pour les documents disponibles dans le fonds documentaire de l'INIST/CNRS.
L’utilisation d’un robot conduit GS à trouver de nombreux doublons (duplicates) sur les sites web visités. Ces doublons sont gardés et indiqués par« versions ».
L’exploitation de ces doublons permet souvent de retrouver un texte en accès libre. Accès au texte intégral Si la recherche est gratuite de n’importe où, l’accès au texte intégral des articles de périodiques commerciaux n’est possible que depuis une institution abonnée sauf si une version du texte est présente dans un serveur d’archives ouvertes ou s’il s’agit d’un journal Open Access. Classement des résultats La méthode de tri n’est pas explicitée mais repose sans doute sur un calcul de pertinence qui prend en compte le texte de chaque article ainsi que le(s) auteur(s), la publication et le nombre de fois où il est cité. Articles récents: en avril 2006 a été introduit un classement par date, les plus récents en tête ; une liste déroulante des années permet ensuite de préciser l’année de départ.
6
B-Scirus SCIRUS est un moteur de recherche spécialisé dans la recherche de documents de nature scientifique publiés sur le web, produit par Elsevier Science à partir de la technologie FAST. Contrairement aux moteurs de recherche généralistes qui signalent toutes les pages découvertes par leur robot, SCIRUS n’indexe que les pages présentes sur des serveurs référencés par Elsevier pour leur contenu scientifique. L’ensemble des sites est pris en compte alors que souvent les robots généralistes n’indexent qu’une fraction des sites trouvés. Les résultats sont ainsi moins hétérogènes et mieux ciblés. SCIRUS donne accès à la fois à des ressources publiées par des éditeurs et à des ressources non publiées : • Pages d’universités (noms de domaines en .edu, .ac.uk et sites universitaires dans d’autres pays)  • Organisations scientifiques (.org) et pages de congrès, conférences • Pages de compagnies fournissant de l’information scientifique (R&D) (.com) • Pages gouvernementales en rapport avec les sciences, dont la santé ou le juridique (.gov) • Pages de scientifiques Sources : En plus des pages web repérées par son robot, Elsevier a ajouté des documents issus de ses ressources électroniques (ScienceDirect), de bases de données (Medline, Nasa, Beilstein), des brevets us, de serveurs de pré-publications et Open Archive. SCIRUS a aussi passé des accords spécifiques avec des éditeurs comme l’Institute of Physics Publishing (IOP) pour une prise en compte complète de leur fonds documentaire. On peut donc : • soit interroger l’ensemble de ces ressources, • soit se limiter à l’une ou l’autre. SCIRUS indique clairement l’origine des résultats. Domaines couvertsd’informations scientifiques à destination des étudiants, tous domaines  : enseignants et chercheurs. Langue: majoritairement en anglais Volume plus de 250 millions de documents (dont plus de 20 millions de références : bibliographiques) issus de MEDLINE, ScienceDirect, BioMedCentral, serveurs de pre-prints et brevets.
Il faut utiliser un vocabulaire scientifique plutôt que les termes « grand public », par exemple Encéphalopathie spongiforme bovine plutôt que vache folle. L’interrogation se fait en langage naturel et donc l’utilisateur devra réfléchir aux ambiguïtés fréquentes du langage courant : polysémie et synonymie.
Utilisez le formulaireAdvanced Searchpour bénéficier de toutes les possibilités d’interrogation. Syntaxe d’interrogation : + - "" AND OR ANDNOT Recherche par champs : document complet ou mots du titre de l’article (mots du titre de la page HTML), mots du nom de journal, noms d’auteur et affiliation, ISSN …
7
Limites : - types d’information (utile pour retrouver un congrès, un brevet ou la page d’accueil d’un  chercheur) - catégories (20 grandes catégories) sources -- date (de 1900 à 2003) -formats de fichiers (HTML, Word et PDF).
Affiner la recherche : La technologie FAST extrait du corpus de résultats une liste de termes pouvant servir à affiner la recherche. SCIRUS repère d’éventuelles fautes d’écriture :Ex : lekemia Did you mean? leukemia Les résultats sont triés par pertinence par défaut. On peut trier par date mais les résultats sont aléatoires pour les pages web.
SCIRUS offre maintenant la possibilité de regrouper des résultants d’une source spécifique. On peut sélectionner les références et : • les sauvegarder dans un fichier, • les envoyer par messagerie, • les envoyer vers un logiciel de gestion documentaire (format RIS).
8
Les résultats issus de journaux proviennent essentiellement de ScienceDirect. L’intérêt principal de SCIRUS réside dans les résultats issus du web : Preferred Web sources et Other Web sources.
C-Copernic
Copernicest disponible en 3 versions : Basic (gratuit), Plus et Pro (éliminations des liens morts, affinement automatique, actualisation des recherches). Il propose, outre le web mondial et les web nationaux, de nombreuses catégories de recherche. Syntaxe La syntaxe est limitée à ET, OU, SAUF et à la recherche d’expression.
Résultats Il affiche les résultats au fur et à mesure qu'il les trouve. Pour chacun, apparaît le titre, une description, l'URL, le nombre d'occurrences, la date de la recherche, « trouvé par », ainsi que l'état (accessible, inaccessible, nouveau, etc.). Ils sont classés par ordre de pertinence, les doublons et les liens périmés étant automatiquement éliminés.
9
Filtrage Une fonction de recherche par mots clés sur les résultats obtenus est disponible. Les opérateurs SAUF et PRES sont disponibles à ce niveau mais SAUF ne peut pas être combiné à une expression et la distance pour PRES n’est pas paramétrable. La troncature est automatique. Élimination des doublons. Élimination des liens morts. Pour la consultation hors ligne, il est possible de télécharger tout ou partie des documents trouvés.
Tri des résultats Par pertinence, titre, URL, date des documents, outils de recherche.
Archivage et diffusion Les résultats peuvent être exportés en HTML, XML, Dbase, texte ou ASCII délimité (CSV).Un historique détaillé des résultats, classés dans des dossiers, peut être créé et mis à jour au fur et à mesure.
Veille Le calendrier est totalement paramétrable.
10
D-OAIster OAIsterest un moteur de recherche spécialisé dans le « moissonnage » (harvesting) des serveurs d’archives ouvertes. Le moissonneur récupère les méta-données, respectant la norme Dublin Core simple, associées à chaque document. Chaque résultat pointe vers la ressource numérique hébergée par une institution représentant principalement des documents textuels (articles scientifiques, pré et post-publications, littérature grise) mais aussi des images fixes, vidéo,... OIAster a été développé à l’Université du Michigan, Digital Library Production Service.
Domaines couverts: base de données multidisciplinaire Langue: majoritairement en anglais mais nombreuses autres langues Volume :900 000 notices issues de plus de 930 institutions en janvier 2008plus de 14 Période couverte: inconnue Mise à jour :hebdomadaire pour les dépôts conformes sinon mensuelle La recherche peut s'effectuer : ·alphabétique des institutions (plus de 900)Par le parcours de la liste ·Par le formulaire de recherche : opar mots issus des titres, résumés et mots-clés d’auteur opar champs (auteur, titre, date, …) Il n’y a pas de recherche sur le texte intégral puisque OAIster ne récupère que les métadonnées. La recherche sur sujet se fait par défaut sur l’ensemble des champs. Il est possible de n’interroger que le champ Titre ou que le champ Sujet. L’interrogation s’effectue en langage naturel. ATTENTIONauxambiguïtés:synonymie polysémie
Pensez aux différences entre l’américain et l’anglais : fiber/fibre flavor/flavouraluminum/aluminium sulfur/sulphur tire/tyre
Pensez au singulier et pluriel en tronquant les termes de recherche avec l’étoile et plus généralement pour la recherche sur la racine d’un mot : civ*donneraciv,civil,civic,civilization et civilian La recherche d’expression est automatiquement gérée dès que l’on entre 2 termes.
11