these.repro.rtf
179 pages
Français

these.repro.rtf

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
179 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

UNIVERSITE GRENOBLE I – JOSEPH FOURIERUFR D'INFORMATIQUE ET DE MATHEMATIQUESAPPLIQUEESNo attribué par la bibliothèque|_/_/_/_/_/_/_/_/_/_/THESEpour obtenir le grade deDOCTEUR DE L'UNIVERSITE GRENOBLE IDiscipline : Informatiqueprésentée et soutenue publiquementparNicolas THIERRY-MIEGle 17 Octobre 2001Titre :Modélisation informatique et analyse prédictive desinteractions protéine-protéine chez Caenorhabditis elegans___________________JURYRapporteurs : Richard DURBIN François JACQUENETExaminateurs : Jacques COHEN Paul JACQUET Thierry VERNET Marc VIDALDirecteur de thèse : Laurent TRILLING12RemerciementsMes travaux de thèse se situent à l’interface entre la biologie etl’informatique. De plus, ils se sont déroulés dans deux localités géographiques :principalement dans l’équipe dirigée par Laurent Trilling au sein du laboratoireLogiciels-Systèmes-Réseaux, à Grenoble, mais aussi à Boston où j’ai été accueillidans l’équipe de Marc Vidal au cours de trois séjours d’une durée totale de septmois, initialement au Massachusetts General Hospital Cancer Center puis au DanaFarber Cancer Institute. Je voudrais en premier lieu remercier ...

Informations

Publié par
Nombre de lectures 30
Langue Français

Extrait

UNIVERSITE GRENOBLE I – JOSEPH FOURIER
UFR D'INFORMATIQUE ET DE MATHEMATIQUES
APPLIQUEES
No attribué par la bibliothèque
|_/_/_/_/_/_/_/_/_/_/
THESE
pour obtenir le grade de
DOCTEUR DE L'UNIVERSITE GRENOBLE I
Discipline : Informatique
présentée et soutenue publiquement
par
Nicolas THIERRY-MIEG
le 17 Octobre 2001
Titre :
Modélisation informatique et analyse prédictive des
interactions protéine-protéine chez Caenorhabditis elegans
___________________
JURY
Rapporteurs : Richard DURBIN
François JACQUENET
Examinateurs : Jacques COHEN
Paul JACQUET
Thierry VERNET
Marc VIDAL
Directeur de thèse : Laurent TRILLING
12Remerciements
Mes travaux de thèse se situent à l’interface entre la biologie et
l’informatique. De plus, ils se sont déroulés dans deux localités géographiques :
principalement dans l’équipe dirigée par Laurent Trilling au sein du laboratoire
Logiciels-Systèmes-Réseaux, à Grenoble, mais aussi à Boston où j’ai été accueilli
dans l’équipe de Marc Vidal au cours de trois séjours d’une durée totale de sept
mois, initialement au Massachusetts General Hospital Cancer Center puis au Dana
Farber Cancer Institute. Je voudrais en premier lieu remercier vivement Laurent
Trilling, qui a accepté de diriger cette thèse, s’y est investi sans ménagement au
prix d’une reconversion thématique, et a su toujours proposer des pistes
prometteuses tout en me laissant totalement libre de choisir ma voie. Je remercie
tout aussi chaleureusement Marc Vidal, pour son énergie débordante et sa science
exceptionnelle, sans qui le sujet même de cette thèse n’aurait pas eu lieu d’être. Je
remercie également Thierry Vernet et Jacques Cohen, qui m’ont apporté un
encadrement supplémentaire avec grand enthousiasme, en biologie à Grenoble et
en informatique à Boston, respectivement. Je tiens aussi à remercier Paul Jacquet
et Ed Harlow, qui m’ont accueilli dans leurs laboratoires. Je remercie tous les
membres de mon jury, en particulier Richard Durbin et François Jacquenet qui ont
accepté d’être rapporteurs de ma thèse. Je remercie Anne Davy, ainsi que Jean-
François Boulicaut et Baptiste Jeudy, avec qui j’ai eu le plaisir de collaborer. Je
remercie Proteome Inc., qui m’a donné un accès privilégié aux données
d’interaction de la base YPD. Je remercie toutes les personnes que j’ai côtoyé
dans les laboratoires à Grenoble et Boston, qui m’ont rendu la vie et le travail plus
agréable, en particulier Rose-Ann, Valérie, Pascal et Enzo, ainsi que Michel et
Sébastien. Je veux aussi remercier mes parents Danielle et Jean pour leur soutien
moral et scientifique. Et bien sûr je remercie mes amis, les montpelliérains et les
autres, car pour travailler bien il faut bien se détendre… Merci enfin à Delphine,
qui m’a donné Lila, et à Lila, qui m’a appris que le sommeil est un luxe.
34TABLE DES MATIERES
REMERCIEMENTS............................................................................................................................................. 3
TABLE DES MATIERES..................................................................................................................................... 5
1.INTRODUCTION .............................................................................................................................................. 9
1.1 CADRE THÉMATIQUE ..................................................................................................................................... 9
1.2 SUJET ET APPROCHE..... 11
1.3 PLAN DE L'EXPOSÉ........ 13
2. ETAT DE L'ART ............................................................................................................................................ 17
2.1 PRÉDICTION D'INTERACTIONS PROTÉINE-PROTÉINE ..................................................................................... 17
2.2 TECHNIQUES D'EXTRACTION DE CONNAISSANCES DANS LES BASES DE DONNÉES (KDD) ............................ 19
2.2.a Introduction à l'extraction de règles d'association, notion d'itemset fréquent.................................... 19
2.2.b Définition du problème ....................................................................................................................... 20
2.2.c L'algorithme Apriori ........................................................................................................................... 22
2.2.c.1 Treillis des ensembles fréquents potentiels ...................................................................................................23
2.2.c.2 Programme Apriori .......................................................................................................................................24
2.2.d L'algorithme Close, notion d'itemset fermé......................................................................................... 26
2.2.d.1 Connexion de Galois....................................................................................................26
2.2.d.2 Treillis des ensembles fermés........................................................................................................................28
2.2.d.3 L'Algorithme Close..................................29
2.2.d.4 Programme Close........................................................................................................30
3. GÉNOMIQUE FONCTIONNELLE CHEZ C. ELEGANS ......................................................................... 33
3.1 CLONAGE DE L'ORFÉOME ........................................................................................................................... 34
3.1.a Objectif et méthode ............................................................................................................................. 34
3.1.b Mise en œuvre ..................................................................................................................................... 35
3.1.c Résultats.............................................................................................................................................. 40
3.2 INTERACTIONS PROTÉINE-PROTÉINE 42
3.2.a Le système double hybride .................................................................................................................. 42
3.2.b Cartographie des interactions entre protéines chez C. elegans.......................................................... 45
3.2.c La base de données WISTdb................ 46
3.3 CONCLUSION ............................................................................................................................... 50
4. INTERDB : UNE BASE DE DONNÉES POUR LA PRÉDICTION D'INTERACTIONS
PROTÉINE-PROTÉINE .................................................................................................................................... 53
4.1 OBJECTIFS ET APPROCHES ........................................................................................................................... 54
4.1.a Interactions entre protéines ................................................................................................................ 54
4.1.b Identification des protéines.................... 56
54.1.c Caractérisation des protéines ............................................................................................................. 56
4.2 MISE EN ŒUVRE .......................................................................................................................................... 59
4.2.a Conception du schéma d'InterDB ....................................................................................................... 59
4.2.b Acquisition des données d'InterDB ..................................................................................................... 60
4.2.b.1 Acquisition des données protéiques ..............................................................................................................60
4.2.b.2 Acquisition des données d'interaction ..................................................................................62
4.3 RÉSULTATS................... 64
4.3.a Contenu de InterDB ............................................................................................................................ 64
4.3.b Mise à jour de InterDB ....................................................................................................................... 65
4.4 CONCLUSION................ 67
5. PRÉDICTION D'INTERACTIONS PROTÉINE-PROTÉINE .................................................................. 69
5.1 MODÉLISATION DES DONNÉES........................................

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents