Thèse JDP

De
Publié par

UNIVERSITE DE TOULON ET DU VAR N° attribué par la bibliothèque |_|_|_|_|_|_|_|_|_|_| THESE POUR L’OBTENTION DU DOCTORAT EN SCIENCES DE L’INFORMATION ET DE LA COMMUNICATION A L’UNIVERSITE DE TOULON ET DU VAR conforme au nouveau régime défini par l’arrêté du 30 mars 1992 METHODOLOGIE ET STRUCTURATION D’UN OUTIL DE DECOUVERTE DE CONNAISSANCES BASE SUR LA LITTERATURE BIOMEDICALE : UNE APPLICATION BASEE SUR L’EXPLOITATION DU MESH présentée et soutenue publiquement le 28 février 2006 par Jean-Dominique PIERRET Galderma R&D Sophia-Antipolis Sous la Direction de M. Luc QUONIAM Professeur à l’Université de Toulon et du Var Membres du jury : M. Yves-François LE COADIC (Rapporteur) Professeur au Conservatoire National des Arts & Métiers M. Thierry LAFOUGE (Rapporteur) Professeur à l’Université Claude Bernard M. Fabrizio DOLFI Docteur en Médecine, Galderma R&D Sophia-Antipolis M. Eric BOUTIN (Tuteur) Maître de conférences à l’Université de Toulon et du Var Je tiens à remercier la société Galderma R&D Sophia-Antipolis pour m’avoir permis de réaliser ce travail, mais plus encore, pour avoir réuni les conditions nécessaires à la genèse du DPM. Merci à Luc Quoniam de m’avoir transmis le virus de la bibliométrie, voici maintenant plus de 13 ans, et cette idée que derrière une fréquence, aussi faible soit-elle, peut se cacher une information d’une grande valeur. Je suis très honoré que Luc soit mon Directeur de thèse. Merci ...
Publié le : samedi 24 septembre 2011
Lecture(s) : 63
Nombre de pages : 190
Voir plus Voir moins

UNIVERSITE DE TOULON ET DU VAR


N° attribué par la bibliothèque
|_|_|_|_|_|_|_|_|_|_|

THESE POUR L’OBTENTION DU DOCTORAT EN SCIENCES DE L’INFORMATION ET DE LA
COMMUNICATION A L’UNIVERSITE DE TOULON ET DU VAR
conforme au nouveau régime défini par l’arrêté du 30 mars 1992

METHODOLOGIE ET STRUCTURATION D’UN OUTIL
DE DECOUVERTE DE CONNAISSANCES BASE SUR LA
LITTERATURE BIOMEDICALE :
UNE APPLICATION BASEE SUR
L’EXPLOITATION DU MESH

présentée et soutenue publiquement le 28 février 2006
par Jean-Dominique PIERRET
Galderma R&D Sophia-Antipolis

Sous la Direction de
M. Luc QUONIAM
Professeur à l’Université de Toulon et du Var


Membres du jury :

M. Yves-François LE COADIC (Rapporteur)
Professeur au Conservatoire National des Arts & Métiers

M. Thierry LAFOUGE (Rapporteur)
Professeur à l’Université Claude Bernard

M. Fabrizio DOLFI
Docteur en Médecine, Galderma R&D Sophia-Antipolis

M. Eric BOUTIN (Tuteur)
Maître de conférences à l’Université de Toulon et du Var
Je tiens à remercier la société Galderma R&D Sophia-Antipolis pour m’avoir permis de
réaliser ce travail, mais plus encore, pour avoir réuni les conditions nécessaires à la
genèse du DPM.

Merci à Luc Quoniam de m’avoir transmis le virus de la bibliométrie, voici maintenant
plus de 13 ans, et cette idée que derrière une fréquence, aussi faible soit-elle, peut se
cacher une information d’une grande valeur. Je suis très honoré que Luc soit mon
Directeur de thèse.

Merci à Eric Boutin pour son support constant et enthousiaste tout au long de ce travail.
L’idée de réaliser cette thèse sur le DPM revient à Eric, je le remercie pour cette
initiative.

Sans Fabrizio Dolfi, critique dynamique, constructif et éclairé, le DPM n’aurait
certainement pas existé. Merci à toi mon ami.

Merci aux professeurs Yves-François Le Coadic et Thierry Lafouge pour avoir accepté
d’être rapporteurs de cette thèse.

Merci enfin à celles et ceux qui ont contribué à la réalisation de ce projet : Nadège
Tremel, Annick Pierret, Marie-Jo Lejard, Irina Safonova, Christian Gerini, Christian
Loesche, Philippe Walter et Marc Weeber.




A Nadège













































The most exciting phrase to hear in science, the one that heralds new
discoveries, is not 'Eureka!' (I found it!) but 'That's funny ...'

Isaac Asimov
SOMMAIRE

Abréviations et conventions d’écriture vi

Introduction 1
Augmentation du volume d’informations… 2
…et fragmentation du savoir… 5
…vers un nouveau mode d’exploitation des bases de données
bibliographiques 7
Le contexte de l’industrie pharmaceutique 8
Maladie de Raynaud et huile de poisson : la première découverte
de Don Swanson et le modèle ABC 10
Pour ésumer 12 lande lathèse3

Première Partie : état de l’art 15
1.1 Historique de la découverte de Don Swanson 15
1.2 Le cadre épistémologique 17
1.3 Maladie de Raynaud et huile de poisson 20
1.3.1 Introduction du modèle ABC 20
1.3.2 Méthode bibliographique 22
1.3.2.1 Etude des co-citations 23
1.3.2.2 Etude du couplage bibliographique 25
1.3.2.3 Analyse des littératures complémentaires :
effet plausible de l’huile de poisson sur
la maladie de Raynaud 27
1.4 Migraine et magnésium, une seconde découverte à partir de
la méthode bibliographique 30
1.5 La méthodologie explore/exclude ou trial-and-error 32
1.5.1 Première partie : exploration 33
1.5.2 Seconde partie :exclusion 35
1.5.3 Résuméde la méthode bibliographique 36
1.6 Le modèle ABC 37
1.6.1 Le savoir public caché 38
1.6.2 Processus de découverte ouvert ou fermé 39
1.6.3 Logique non-booléene 40
1.7 Systèmes d’aide à la découverte de connaissance 41
1.7.1 Arrowsmith 41
1.7.2 Le DAD 45
1.7.2.1 Générer C →B 46
1.7.2.2 Générer B →A7
1.7.2.3 Tester A →B ←C
1.7.2.4 Etude DAD sur de nouveaux usages
potentiels de la thalidomide 48
i1.7.2.5 Effets indésirables désirables 48
1.7.3 Autres systèmes 50
1.8 Conclusion de la première partie : valeur de la méthode de Swanson 53

Deuxième partie : le DPM (Diseases – Physiopathology – Molecules) 57
2.1 Anamnèse 57
2.2 Les sources de la National Library of Medicine 59
2.2.1 La citation Medline 61
2.2.2 LeMeSH 62
2.2.2.1 Le MeSH Tree 62
2.2.2.2 Descripteurs et subheadings 63
2.2.2.3 Descripteurs majeurs 66
2.2.2.4 Explosion : utilisation de la hiérarchie 66
2.2.2.5 Supplementary Concepts Records 67
2.2.2.6 Mises à jours du MeSH 68
2.3 La première expérience DPM 69
2.3.1Constitution des dictionnaires 71
2.3.2 Interrogation de Medline sur la maladie de Raynaud 72
2.3.3 Extraction des concepts B 73
2.3.4 Interrogation de Medline à partir des concepts B 75
2.3.5 Extraction des concepts A 76
2.3.6 Au-delà de l’huile de poisson 78
2.3.7 Epilogue de la première expérience DPM 80
2.4 La deuxième expérience DPM 81
2.4.1 Extraction des concepts B de la littérature sur
la maladie de Raynaud 81
2.4.2 Extraction des concepts B de la littérature sur
l’huile de poisson 81
2.4.3 Identification des concepts B communs aux
deux littératures : tester C →B ←A 83
2.4.4 Une première modification du tableau
des concepts communs 84
2.5 La troisième expérience DPM 88
2.5.1 Etape 1 : définition de la physiopathologie 89
2.5.2 Etape 2 : requêtes Medline 92
2.5.3 Etape 3 : extraction des concepts,
création destableaux 94
2.5.3.1 Extension du calcul du coefficient
à n colnes 96
2.5.3.2 Autres tableaux 98
2.5.3.3 Présentation graphique 102
2.5.4 Etape 4 : analyse par l’expert 103
2.6 Les biais du DPM 107
2.6.1 La nature du lien entre deux concepts 10
2.6.2 L'utilisation du MeSH 108
2.6.3 Choix des phénomènes physiologiques 109
ii 2.6.4 Problèmes de hiérarchie 109
2.6.5 Thesaurus et résultats négatifs 110
2.7 Conclusion de la deuxième partie 111

Troisième partie :Evolutions possibles du DPM 113
3.1 LeDPM etMedline 11
3.1.1 DPM ettexte libre 114
3.1.1.1 Travail sur les titres seuls 115
3.1.1.2 Travail sur les titres et abstracts 117
3.1.1.3 Remarques sur le travail sur
les titres et/ou abstracts 119
3.1.2 DPM et champs contrôlés 121
3.1.2.1 EC/RN Number 1
3.1.2.2 Secondary Source ID 123
3.2 Découverte de connaissances
et autres sources d’information 125
3.2.1 Bases dedonnées bibliographiques 5
3.2.2 Découverte de connaissances et Internet 126
3.3 Conclusion de la troisième partie 131

Conclusion 13
4.1 DPM, industrie pharmaceutique et expertise 133
4.2 Diffusion du modèle de Swanson 138
4.3 Retour sur le travail de Swanson 141

Bibliographie 147

Annexe 1 : bibliographie supportant la première découverte de Swanson 158
A1.1 Bibliographie sur la maladie de Raynaud – 34 articles 158
A1.2 Bibliographie sur l’huile de poisson – 25 articles 163
A1.3 Bibliographie complémentaire (articles cités, couplage …) 166

Annexe 2 : exemple de citation Medline 167
Annexe 3 : dictionnaires DPM selon le MeSH 2005 169
A3.1 Tre Drugs 169
A3.2TreePoteins/Targets 169
A3. Tre Physiolgy 170 4Dieas
A3.5 Tree Antomy 170
A3.6 TreeDietary Factors 171
Annexe 4 : liste des concepts B (physiologie) du premier DPM
maladie de Raynaud/huile de poisson 172

Annexe 5 : liste des concepts A (dietary factors) du premier DPM
maladie de Raynaud/huile depoisson 174
iiiIndex des figures


Figure 1 : Evolution du volume de citations de PubMed 2
Figure 2 : Répartition annuelle du nombre de citations SciSearch
contenant les mots needle et haystack 4
Figure 3 : Evolution du volume d’informationdisponible au cours du temps 6
Figure 4 : Méthode bibliographique, exploration 35
Figu5 :Le modèle ABC 37
Figure 6 : Modèle ABC appliqué à l’exploration des liens entre l’huile
de poisson et la maladie de Raynaud 38
Figure 7 : Modèle ABC, processus ouvert 39
Figu8 :ModèleABC,procfermé 40
Figure 9 : Schéma de la première expérience DPM 69
Figure 10 : Schéma de la deuxième expérience DPM 81
Figure 11 :Cycle du DPM 89
Figu12 : Modèle ABC, centré sur l’approche DPM 91
Figure 13 : Schéma de la troisième expérience DPM 94
Figure 14 : Représentation graphique du tableau DPM à 5 colonnes 97
Figure 15 : Illustration graphique du tableau 11 103
Figure 16 : Phases de recherche et développement d’un médicament 135
Figure 17 : Phases de recherche d’un médicament 136
Figure 18 : Stratégies de recherche et développement d’un médicament 137
Figure 19 : Suivi des citations des articles publiés par Swanson
sur sa méthode ou sur ses hypothèses 141
iv

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.