Introduction à l'Informatique Médicale

De
Publié par

  • cours - matière potentielle : construction
Introduction à l'Informatique Médicale Recherche d'information médicale en utilisant PubMed et le MeSH Module 1 – Automne 2002 Christian Lovis Antoine Geissbuhler Division d'Informatique Médicale Hôpitaux Universitaires de Genève
  • table d'équivalence des auteurs
  • table de correspondance
  • mesh
  • noms d'auteurs
  • nom de l' auteur
  • nom de l'auteur
  • nom auteur
  • nom d'auteur
  • pubmed
  • permet
  • mots
  • mot
  • champs
  • champ
  • références
  • référence
  • recherche
  • recherches
Publié le : mardi 27 mars 2012
Lecture(s) : 84
Source : cours.sim.hcuge.ch
Nombre de pages : 14
Voir plus Voir moins

Introduction à l’Informatique Médicale

Recherche d’information médicale en utilisant PubMed et le MeSH


Module 1 – Automne 2002
Christian Lovis
Antoine Geissbuhler
Division d’Informatique Médicale
Hôpitaux Universitaires de Genève Module 1 – recherche d’information
Introduction
Medline (MEDical Literature Analysis and Retrieval System on LINE)
Medline est une banque de données produite par la Nationale Library of Medicine (NLM) à
Bethesda (USA) et couvrant les domaines biomédicaux tells que la biologie, la biochimie, la
médecine clinique, la santé publique, l’éthique, l’économie, la pharmacologie, la psychiatrie, la
toxicologie, l’odontologie et la médecine vétérinaire.
Plus de 10 millions de documents, essentiellement des publications, sont indexes don’t les ¾
avec un résumé.
La banque de données Medline est interrogeable par Internet en utilisant le logiciel Entrez et
son interface Internet PubMed. Logiciel Entrez est en fait un système de "retrieval data" qui
ne sert pas uniquement à PubMed. Il est possible de chercher dans d'autres bases de la NLM,
telle que AidsLine.

Medline fournit une indexation automatique sur les mots du titre et du résumé et une
indexation manuelle par des indexeurs, qui assignent les termes MeSH sur le contenu global
de l'article. A noter que les publications indexées comprennent toutes certains descripteurs
obligatoires, comme le type d’article ou la langue
Etats des références accessibles
Les références de PubMed se distinguent en fonction de trois niveaux:
les références envoyées par voie électronique par un éditeur. Elles sont identifiées par la
mention "PubMed - as supplied by publisher" et ne sont pas encore indexées
les références en attentes d'indexation et reconnaissable à la mention "PubMed - in process"
les référence définitives, indexées complètement et vérifiées, reconnaissable à la mention
"PubMed - indexed for MEDLINE"
Dans PubMed, les références reçoivent un "Medline UI (unique identifier)" et un "PMID
(PubMed identifier)". A noter que l'indexation peut être plus ou moins rapide (immédiate à 1
an) en fonction des périodiques considérés.
Contenu de la base: périodiques indexés
La liste complète des périodiques indexés est disponible sur le lien Internet
http://www.nlm.nih.gov/tsd/serials/lji.html]. Plus de 5'000 périodiques sont diponibles.
Le vocabulaire MeSH (Medical Subject Headings)
Les descripteurs MeSH définissent un vocabulaire contrôlé qui permet de décrire les articles
indexés dans Medline. Ce vocabulaire est organisé en une classification hiérarchisée. Une
description est disponible sur le lien http://www.nlm.nih.gov/pubs/factsheets/mesh.htm.
Ce vocabulaire comprends environ 19'000 termes majeurs et est accessible en anglais et en
espagnol. Une version française est en cours de construction par un groupe d’université
francophones. Chaque article va être indexé manuellement en utilisant le MeSH avec jusqu'à
15 descripteurs MeSH différents. Ces termes sont assignés sur la base de l'article complet, ce

2/14 Module 1 – recherche d’information
qui est important pour le peu d'articles qui n'ont pas d'abstract par des indexeurs
professionnels. Les descripteurs MeSH sont choisis parmi des synonymes pour décrire un
concept de façon univoque.
Pour repérer les termes MeSH et les qualificatifs, il est possible d'utiliser le MeSH papier, mais
également son équivalent en ligne le MeSH Browser à l'adresse
http://www.nlm.nih.gov/mesh/2002/MBrowser.html
Chacune des interfaces de Medline possède son propre MeSH Browser. Celui de Pubmed est
expliqué en détail dans ce cours. Ce MeSH browser
http://www.ncbi.nlm.nih.gov/entrez/meshbrowser.cgi présente l'avantage d'être lié à l'écran
de recherche et donc de permettre l'introduction d'un terme MeSH trouvé dans le MeSH
Browser dans une requête.
Tous les documents dans PubMed ne sont pas indexés avec des termes MeSH. Soit parce qu'il
sont en attente d'indexation (le délai peut varier de quelques jours à plusieurs mois selon les
périodiques indexés) ou bien parce que il s'agit de documents très courts (exemple: letters to
the editors) qui ne sont pas indexés du tout
L'arborescence MeSH
Les termes MeSH sont classés selon une arborescence qui décrit tout d'abord des notions
générales englobant de nombreux concepts, pour arriver progressivement à des notions très
spécifiques. Les termes situés "au dessus" des autres sont dits termes "parents" tandis que
ceux qui se situent "en dessous" sont dits termes "enfants".


Il existe 15 catégories recouvrant toutes les notions générales retrouvées dans la base
Medline:


3/14 Module 1 – recherche d’information


On peut ouvrir la hiérarchie en comme une structure de répertoires sur un disque dur. Un
même descripteur MeSH peut appartenir a plusieurs hiérarchies. Lors de l'indexation, les
indexeurs définissent deux catégories de termes MeSH pour chaque document indexé:
Les termes MeSH majeurs [MAJR] (reconnus dans les références car ils sont précédés de *)
qui reflètent le sujet principal des articles,
termes
Les termes MeSH non majeurs [MH] (peuvent refléter une petite partie de l'article en
question).
Parmi les termes MeSH, certains sont dits "obligatoires". Ils sont obligatoires dans le sens où
chaque indexeur doit obligatoirement les assigner à tout article. Il s'agit entre autres du genre
(animal, humain), de la tranche d'age ou encore du type d’article.
L'explosion de recherche
Une recherche faite avec un terme MeSH (majeur ou pas) ne retrouvera pas seulement les
documents indexés avec ce terme, mais aussi tous ceux indéxées avec les termes spécifiques
(enfant) à ce terme (situés "en dessous" de lui dans l'arborescence). Il s'agit de la notion
d'explosion. Celle-ci est automatique (par défaut) pour toutes les recherches.
Si l'utilisateur veut éviter cette explosion automatique, il faut qu'il spécifie après le terme en
question: [mh:noexp] (ou [MAJR:noexp] s'il s'agit d'un terme MeSH majeur) qui évite la
recherche avec les termes fils plus spécifiques.
Exemple de recherche avec Bone comme terme majeur:

4/14 Module 1 – recherche d’information

Cette recherche permet d’obtenir deux entrées dans la hiérarchie, sous Skeleton et sous
Connective Tissue. Si on fait une recherche dans Pubmed avec ce terme, tous les articles
indexés avec les codes en dessous (codes fils) des deux entrées ci-dessus vont être trouvées.
Ceci peut ramener de très nombreux résultats et s’appelle l’ »explosion ».
Le “mapping”, remplacement automatique
Le mapping consiste au remplacement automatique d'un terme non-MeSH par un terme
MeSH. Lorsque l'utilisateur fait une requête avec un terme qui n'est pas indexé MeSH, une
table de correspondance va être utilisée afin de trouver un ou plusieurs termes MeSH qui
semblent proches. Ce mapping est le comportement par défaut de PubMed mais peut être
désactivé en tappant le terme recherché entre guillemets. Ce mapping se réalise par défaut.
Pour l'éviter et rechercher d'emblée dans les champs, il faut rentrer le mot entre "et". A noter
que lorsque la table de correspondance ne trouve pas d'équivalent, la recherche s'effectue sur
tous les champs avec le mots saisi.
L'ordre de recherche dans les tables de correspondances est immuable et tel que suit:
1. table d'équivalence MeSH: qui contient les termes MeSH, les qualificatifs et les noms
de substances.
2. table d'équivalence des noms de journaux: qui contient les noms complets des
périodiques, les abréviations Medline et les numéros ISSN, y compris sur l'abréviation
Medline qui est ouverte. Dans le cas ou le titre du périodique (ex: gene therapy) est
également un terme MeSH, le mapping est tel que la recherche s'effectue dans les
termes MeSH et les mots du texte.
3. table d'équivalence des phrases si aucun terme équivalent n'a été retrouvé dans la
table de correspondance MeSH et des noms de journaux. Ces phrases existantes sont

5/14 Module 1 – recherche d’information
générées à partir du vocabulaire MeSH, et du "Unified Medical Language System"
(UMLS).
4. table d'équivalence des auteurs si, le terme n'a pas d'équivalence dans les 3 tables
précédentes et qu'il est suivi d'une ou 2 lettres. Les noms d'auteurs doivent être saisis
avec le nom de famille en entier et sans majuscules suivi, optionnellement, de la
première lettre de chaque prénom.
En fait la recherche de correspondance se fait d'abord sur tous les mots, si aucune
correspondance n'est trouvée, le terme de droite est éliminé, et la tentative de trouver une dance reprend. Si il n'existe aucune correspondance, le terme est recherché dans le
champ [All Fields].
Pondération et critères majeurs
On identifie un critère majeur en indiquant [MAJR]. Il est possible de filtrer une requête en
forçant la présence de termes MeSH majeurs dans les résultats. Il s'agit d'utiliser uniquement
les descripteurs MeSH majeurs. Cela est intéressant lorsque l'on veut limiter sa recherche aux
documents où le terme MeSH recherché est le sujet principal de l'article. Attention, le nombre
de réponses est réduit considérablement lors des recherches utilisant la pondération. exemple
de recherche : "Bone and Bones"[MESH] AND "Bone and Bones/surgery"[MAJR]
L’élément [MESH] indique qu’on recherche des articles indexés ainsi avec cet élément,
L’élAJR] indique qu’il doit s’agir d’un major topic uniquement, sans explosion
et finalement, la barre oblique dans Bone and Bones/surgery indique qu’on recherche la
chirurgie uniquement lorsque sous-classée à Bone, il s’agit d’un qualificatif.
Les qualificatifs (subheadings)
On identifie un qualificatif par apposition à un terme MeSh ou par [SH], pour subheadings. Les
qualificatifs sont apposés aux descripteurs MeSH afin d'en préciser le sens. La syntaxe est la
suivante: MeSH/qualificatif, comme dans Bone and Bones/surgery. Il n’est possible
d’attacher qu’un seul qualificatif par terme MeSH à la fois. Ainsi, asthma/diet therapy surgery
sera remplacé par asthma/diet surgery OR asthma/surgery).
Certains qualificatifs ne peuvent pas être apposés à ces termes MeSH, dans ce cas, il faut
utilisé la syntaxe: terme [MESH] AND qualificatif [SH] pour "forcer" l'apposition.
Pour connaître le détail d'un qualificatif particulier, il faut utiliser le browser MeSH
http://www.nlm.nih.gov/mesh/MBrowser.html], saisir le nom du qualificatif en prenant soin de
cocher la case "qualifiers".
Liste des abréviations des qualificatifs
Abnormalities AB Classification CL Growth and GD
Administration and AD Complications CO Development
Dosage History HI Congenital CN
Adverse Effects AE Contraindications CT Immunology IM
Agonists AG Injuries IN Cytology CY
Analogs and AA Deficiency DF Innervation IR
Derivatives Instrumentation IS Diagnosis DI
Analysis AN Diagnostic Use DU Isolation and IP
Anatomy and AH Purification Diet Therapy DH
Histology LegislationLJ Drug Effects DE
Antagonists and AI Jurisprudence Drug Therapy DT
Inhibitors Manpower MA Economics EC
Biosynthesis BI Metabolism ME Education ED
Blood Supply BS Methods MT Embryology EM
Blood BL Microbiology MI Enzymology EN
Cerebrospinal Fluid CF Mortality MO Epidemiology EP
Chemical Synthesis CS Nursing NU Ethnology EH lly Induced CI Organization and OG Etiology ET
Chemistry CH Administration Genetics GE

6/14 Module 1 – recherche d’information
Parasitology PS Radionuclide RI Toxicity TO
Pathogenicity PYImaging Transmission TM
Radiotherapy RT Pathology PA Transplanation TR
Pharmacokinetics PK Rehabilitation RH Trends TD
Secondary SC Pharmacology PD Ultrasonography US
Physiology PH Secretion SE Ultrastructure UL
Standards ST opathology PP Urine UR
Poisoning PO Statistics and SN Utilization UT
Numerical Data Prevention and PC Veterinary VE
Control Supply and SD Virology VI
Distribution Psychology PX
Surgery SU Radiation Effects RE
Therapeutic Use TU Radiography RA
Therapy TH

Les qualificatifs sont également organisés sous la forme d'une arborescence. L'explosion les
concerne donc également des qualificatifs: hypertension/therapy (équivalent à
hypertension/TH car th est l'abréviation de therapy) retrouve hypertension/therapy mais
également hypertension/diet therapy qui est une notion fille. Pour éviter l'explosion
automatique du qualificatif, il faut utiliser la syntaxe: qualificatif [SH:noexp].
L'écran de recherche


Utilisation d’un joker (*)
L’utilisation du joker * permet de faire une requête uniquement sur le début d’un mot. En
plus, il empêche le mapping et l'explosion automatique. L’utilisation du joker permet la
troncature arrière des mots. Lorsqu’elle est utilisée, elle ne permet pas la recherche
d'expressions mais uniquement de mots individualisés. Exemple: adve* ne retrouvera pas
« adverse effect » mais uniquement les mots commençant par adve
Recherche de phrases
Par défaut, une recherche sur plusieurs termes se fera sur l’intersection des termes s’ils sont
mappé en MeSH et leur union dans les autres cas. Exemple « cardiac surgery therapy » va
produire (("thoracic surgery"[MeSH Terms] OR cardiac surgery[Text Word]) AND
("therapy"[MeSH Subheading]).

7/14 Module 1 – recherche d’information

On peut sélectionner l’option Details pour voir le résultat exact du mapping sur l’expression
recherchée.

Utilisation des opérateurs booléens et des intervalles
Les opérateurs booléens tels et AND, ou OR doivent être impérativement entrés en
majuscules. IL est possible d'utiliser les parenthèses. Sans parenthèses, les opérateurs
booléens sont utilisés de gauche à droite.
Intervalles
S'appliquent aux champs:[edat] (date d'entrée dans PubMed) ou [dp] (date de publication) ou
[VI] (volumes d'un périodiques) afin de spécifier un intervalle de temps ou un intervalle
concernant des volumes d'un périodique.
Mots ignorés
Les mots ignorés, ou stopwords, ne sont pas pris en compte dans une recherche car trop peu
spécifiques.
Appliquer des limites à une recherche
Il est possible d'appliquer des limites à ses recherches en de manière simèple, sans avoir à
utiliser de mots réservés particuliers, en utilisant l’option Limits :

8/14 Module 1 – recherche d’information

Explications détaillées :
Permet de sélectionner un
champ d'indexation particulier
Permet de rechercher un type
de publication particulier
Permet de limiter la recherche
à une tranche d'age
spécifique
Permet de limiter la recherche
dans le temps (de 30 jours à
10 ans)
Permet de sélectionner si la
recherche par date se fait sur
la date de publication de
l'article ou celle de l’entrée de
l'article dans PubMed
Permet de spécifier les
valeurs des dates de la
période que l'utilisateur
souhaite couvrir
Permet de limiter sa
recherche au références ayant
un abstract
Permet de limiter sa
recherche à un langage de
publication
Permet de limiter sa
recherche à l'homme ou à
l'animal
Permet de limiter la
recherche à

- une discipline (l'exobiologie

9/14 Module 1 – recherche d’information
par exemple...)
- un sujet donné en limitant
l'interrogation à des
périodiques classés
- de limiter sa recherche à
des articles selon leur état
d’indexation
Permet de limiter sa
recherche au mâles ou aux

femelles

Utilisation des champs d'indexation pour la recherche
Il est possible de saisir directement l'équation de recherche en utilisant les champs
d'indexation. La syntaxe est : terme [champ], soit mettre le nom du champ entre
parenthèse carrées juste après le terme MeSH recherché
Les abréviations des champs peuvent être saisies indifféremment en minuscules ou en
majuscules.
- Affiliation [AD, AFFL]: adresse et appartenance de l'auteur qui assure la
correspondance (principalement pour les demandes de tirés a part), origine des fonds
de recherche.
- All fields [ALL]: tag par défaut: recherche tous les mots de la référence (titre et
résume). Cela est vrai uniquement quand le mapping n'a pas trouvé de
correspondance en utilisant les tables de correspondances. Pour éviter le mapping
automatique, il faut saisir le terme entre guillemets " ".
- Author name [AU, AUTH]: Format: nom jp: nom de l'auteur espace initiales (1 ou 2).
Si l'utilisateur ne mets pas les initiales, o'brien [AU] retrouvera o'brien j, o'brien jp,
o'brien jm…. De même, o'brien j [AU] retrouvera tous les o'brien quel que soit leur
prénom (troncature automatique). Pour retrouver directement uniquement avec les
bonnes initiales, il faut mettre entre "et": "o'brien jp" [AU].
- EC/RN number [RN, ECNO]: Numéro de l'enzyme déterminé par "the Enzyme
Commission" pour spécifier une enzyme ou le CAS number d'une substance chimique.
- Entrez date [EDAT]: date d'entrée de la référence dans PubMed. (différent de [dp]
date de publication). Format YYYY/MM/DD ou YYYY/MM ou YYYY.
- Issue [IP, ISSUE]: numéro (issue) du périodique
- Journal title [TA, JOUR], [SO]: titre de la revue (abrégé ou complet). Voir également
le journal browser.
- Langage [LA, LANG]: langage de parution. Il est possible de mettre le mot entier
(exemple: french) ou les 3 premières lettres (exemple:fre) avec cependant une
exception pour le japonais (JPN au lieu de JAP).
- MeSH Date [MHDA]: ce champ d'existence récente, correpond à la date d'indexation
des références avec les termes MeSH. Format YYYY/MM/DD ou YYYY/MM ou YYYY. Tant
que la référence n'est pas indexée, ce champ prend la valeur du champ Entrez date
(date d'entrée dans PubMed).
- MeSH Major Topics [MAJR]: terme MeSH majeur. Explosion implicite. Pour ne pas
exploser: [MAJR:noexp]. L'utilisation de ce champ permet de pratiquer une
"pondération".
- MeSH Terms [MH, MESH]: Terme MeSH. Explosion implicite. Pour ne pas exploser:
[MH:noexp]. Impose la recherche du terme MeSH correspondant au terme que l'on a
rentré.
- Page number [PG, PAGE]: numéro de la 1ere page de l'article.
- Personal Name as subject [PS]: nom personnel comme sujet, retrouve un nom mais
pas d'auteur, mais plutôt quand un nom propre est le sujet de l'article. Même format
et contraintes que le champ [AU].
- Date of publication [DP, PDAT]: (attention, différent de [EDAT]). Date de publication.
YYYY/MM/DD ou YYYY/MM ou YYYY.
- Publication type [PT, PTYP]: type de publication

10/14

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.