Vers une nouvelle stratégie pour l'assemblage interactif de macromolécules, Towards an interactive tool for the protein docking

De
Publié par

Sous la direction de Bernard Maigret
Thèse soutenue le 30 janvier 2009: Nancy 1
Même si le docking protéine-protéine devient un outil incontournable pour répondre aux problématiques biologiques actuelles, il reste cependant deux difficultés inhérentes aux methodes actuelles: 1) la majorité de ces méthodes ne considère pas les possibles déformations internes des protéines durant leur association. 2) Il n'est pas toujours simple de traduire les informations issues de la littérature ou d'expérimentations en contraintes intégrables aux programmes de docking. Nous avons donc tenté de développer une approche permettant d'améliorer les programmes de docking existants. Pour cela nous nous sommes inspirés des méthodologies mises en place sur des cas concrets traités durant cette thèse. D'abord, à travers la création du complexe ERBIN PDZ/Smad3 MH2, nous avons pu tester l'utilité de la Dynamique Moléculaire en Solvant Explicite (DMSE) pour mettre en évidence des résidus importants pour l'interaction. Puis, nous avons étendu cette recherche en utilisant divers serveurs de docking puis la DMSE pour cibler un résultat consensus. Enfin, nous avons essayé le raffinage par DMSE sur une cible du challenge CAPRI et comparé les résultats avec des simulations courtes de Monte-Carlo. La dernière partie de cette thèse portait sur le développement d'un nouvel outil de visualisation de la surface moléculaire. Ce programme, nommé MetaMol, permet de visualiser un nouveau type de surface moléculaire: la Skin Surface Moléculaire. La distribution des calculs à la fois sur le processeur de l'ordinateur (CPU) et sur ceux de la carte graphique (GPU) entraine une diminution des temps de calcul autorisant la visualisation, en temps réel, des déformations de la surface moléculaire.
-Docking
-Interactions protéiques
-Interactions électrostatiques
-Domaine PDZ d'ERBIN
-Domaine MH2 de Smad3
-Dynamique moléculaire en solvant explicite
-GPU
-Skin Surface Moléculaire
-Déformations de surface
-MetaMol
Protein-protein docking has become an extremely important challenge in biology, however, there remain two inherent difficulties: 1) most docking methods do not consider possible internal deformations of the proteins during their association; 2) it is not always easy to translate information from the literature or from experiments into constraints suitable for use in protein docking algorithms. Following these conclusions, we have developed an approach to improve existing docking programs. Firstly, through modelling the ERBIN PDZ / Smad3 MH2 complex, we have tested the utility of Molecular Dynamics with Explicit Solvent (MDSE) for elucidating the key residues in an interaction. We then extended this research by using several docking servers and the DMSE simulations to obtain a consensus result. Finally, we have explored the use of DMSE refinement on one of the targets from the CAPRI experiment and we have compared those results with those from short Monte-Carlo simulations. Another aspect of this thesis concerns the development of a novel molecular surface visualisation tool. This program, named MetaMol, allows the visualisation of a new type of molecular surface: the Molecular Skin Surface. Distributing the surface calculation between a computer's central processing unit (CPU) and its graphics card (GPU) allows deformations of the molecular surface to be calculated and visualised in real time.
Source: http://www.theses.fr/2009NAN10111/document
Publié le : samedi 29 octobre 2011
Lecture(s) : 32
Tags :
GPU
Nombre de pages : 243
Voir plus Voir moins




AVERTISSEMENT

Ce document est le fruit d'un long travail approuvé par le
jury de soutenance et mis à disposition de l'ensemble de la
communauté universitaire élargie.

Il est soumis à la propriété intellectuelle de l'auteur. Ceci
implique une obligation de citation et de référencement lors
de l’utilisation de ce document.

D’autre part, toute contrefaçon, plagiat, reproduction
illicite encourt une poursuite pénale.


➢ Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr




LIENS


Code de la Propriété Intellectuelle. articles L 122. 4
Code de la Propriété Intellectuelle. articles L 335.2- L 335.10
http://www.cfcopies.com/V2/leg/leg_droi.php
http://www.culture.gouv.fr/culture/infos-pratiques/droits/protection.htm ´Universit´e Henri Poincar´e - Nancy I Ecole doctorale SESAMES
UFR Sciences et techniques de la mati`ere et des proc´ed´es
Vers une nouvelle strat´egie pour
l’assemblage interactif de
macromol´ecules
`THESE
pr´esent´ee et soutenue publiquement le 30 janvier 2009
pour l’obtention du
Doctorat de l’universit´e Henri Poincar´e – Nancy 1
(sp´ecialit´e Chimie Informatique et Th´eorique)
par
Matthieu CHAVENT
Composition du jury
´Rapporteurs : Gilbert DELEAGE
Jo¨el JANIN
Examinateurs : Jean-Paul BORG
Daniel CANET
St´ephane REDON
Dave RITCHIE
´Directeurs : Bruno LEVY
Bernard MAIGRET
´Equipe ORPAILLEUR
Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
UMR 7503 - Campus Scientifique - BP 239 - 54506 Vandœuvre-les-Nancy CedexRemerciements
Je voudrais tout d’abord remercier mes co-directeurs de th`ese Bernard Maigret et Bruno
Levy. Tous les deux m’ont permis de progresser consid´erablement durant ces trois ans.
Bernard m’a fait d´ecouvrir le monde de la recherche et m’a laiss´e libre de faire mes propres
choix. Il m’a aussi permis de d´ecouvrir le monde “tout court” en m’envoyant pr´esenter mes
travaux dans diverses conf´erences autour du globe. Ceci m’a permis d’acqu´erir une certaine
pratique de l’anglais mais, surtout, de vivre des moments inoubliables (je pense en particulier a`
Fortaleza...).
J’ai ´egalement beaucoup appris avec Bruno en informatique. Il m’a montr´e qu’il fallait tou-
jours chercher `a d´epasser ses limites pour avancer... Ce ne fut pas toujours facile mais se fut une
exp´erience tr`es enrichissante. De plus, le programme MetaMol n’aurait jamais vu le jour sans
son aide pr´ecieuse et ses encouragements. Enfin, je me rappelle avec plaisir des quelques mois
pass´es dans son bureau ou` il m’a souvent fait profiter de son enthousiasme et de sa passion pour
l’informatique et le graphisme.
Je souhaite ´egalement remercier Dave Ritchie pour tous les moments agr´eables pass´es `a dis-
cuter(de“Docking”mais´egalementdetoutetderien).J’aimeraiaussileremercierpourm’avoir
permis de me lancer, avec lui, dans l’exp´erience CAPRI. J’esp`ere continuer cette collaboration
le plus longtemps possible.
Je remercie vivement les membres de mon jury d’avoir accept´e de juger mon travail; en
particulier mes rapporteurs, Jo¨el Janin et Gilbert Del´eage, d’avoir pris le temps de relire atten-
tivement mon manuscrit malgr´e des emplois du temps tr`es charg´es.
Je souhaite remercier Stephane Redon de m’avoir chaleureusement accueilli quelques jours
dans son ´equipe `a l’INRIA Grenoble - Rhone-Alpes et de m’avoir fait d´ecouvrir le programme
SAMSON.
Je remercie Jean-Paul Borg et son ´equipe sans qui le projet“Erbin”n’aurait jamais abouti.
Je souhaite tout particuli`erement remercier Nadine D´eliot pour tous les travaux qu’elle a duˆ
mettre en oeuvre pour valider mon mod`ele ainsi que pour sa relecture attentive de la partie de
ma th`ese consacr´ee aux r´esultats biologiques.
Je voudrais particuli`erement remercier Alex, avec qui j’ai pass´e des moments excellents dans
notre bureau commun et que j’esp`ere aller voir prochainement dans sa “cabane” au Canada.
Je n’oublies pas les“anciens”, JP et J´erome,ˆ qui m’ont fait d´ecouvrir phi-science dans toute sa
splendeur.
Un grand merci´egalement a` Laurent, Luc et Pilou pour leurs supports techniques qui m’ont
permis de comprendre un peu mieux les joies de l’informatiques. Je les remercie´egalement pour
les pauses caf´e (mention sp´eciale pour Laurent) et les soir´ees Chtimi (sp´eciale d´edicace a` Pilou
et sa Quack).
iJe remercie ´egalement toute l’´equipe ORPAILLEUR de m’avoir accueilli chaleureusement
et en particulier a` Amedeo Napoli, responsable de celle-ci. Une petite d´edicace pour le groupe
bioinfo Lorraine : Marie-Dominique Devignes, Malika Smaıl-Tabbone et Michel Souchet pour¨
leurs conseils (et relectures) avis´es. Je n’oublie pas non plus les survivants du bureau B235 : un
grand merci a` Yesmine et Nazhia pour leur gentillesse, leur joie de vivre et surtout leur d´elicieux
gˆateaux, L´eo pour les parties de tennis qui m’ont permis de me bouger un minimum et Vincent
pour ses aides FORTRAN et ses contributions non n´egligeables au budget caf´e.
Je tiens a` remercier´egalement les membres de l’´equipe ALICE et en particulier Nicolas Ray,
Bruno Vallet et C´ecile Poisot, pour leur discussions toujours tr`es instructives.
Je remercie ´egalement la r´egion Lorraine et le CNRS qui ont financ´e mes trois ans de th`ese
via une Bourse de Docteur Ing´enieur.
Enfin, je remercie ma famille et mes amis pour leur soutien au quotidien et plus particuli`e-
rement ma D&D qui a toujours ´et´e l`a pour moi...
iiTable des mati`eres
Introduction
1
Les assemblages macromol´eculaires : de l’analyse `a la pr´ediction
1.1 Les interactions prot´eine-acide nucl´eique . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1 Interface et g´eom´etrie des interactions . . . . . . . . . . . . . . . . . . . . 7
1.1.2 Types de r´esidus pr´esents `a l’interface et chimie de l’interaction . . . . . . 11
1.2 Les associations prot´eine-prot´eine . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 Interface et g´eom´etrie des interactions . . . . . . . . . . . . . . . . . . . . 16
1.2.2 Types de r´esidus pr´esents `a l’interface et chimie de l’interaction . . . . . . 19
1.3 Comment caract´eriser un assemblage macromol´eculaire? . . . . . . . . . . . . . . 24
1.3.1 Assemblages prot´eiques vs assemblages prot´eine-acide nucl´eique . . . . . . 24
1.3.2 Assemblages physiques vs assemblages biologiques . . . . . . . . . . . . . 27
1.3.3 Conclusion sur les associations macromol´eculaires . . . . . . . . . . . . . 29
1.4 M´ethodes in silico pour l’assemblage macromol´eculaire . . . . . . . . . . . . . . . 31
1.4.1 Les programmes d’assemblage mol´eculaire . . . . . . . . . . . . . . . . . . 31
1.4.2 Incorporation d’informations pour guider l’amarrage . . . . . . . . . . . . 41
´1.4.3 Evaluation des m´ethodes : Benchmarks et challenge CAPRI . . . . . . . . 43
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2
La dynamique mol´eculaire pour mod´eliser la flexibilit´e des assemblages
2.1 Dynamique de l’association : cin´etique et flexibilit´e . . . . . . . . . . . . . . . . . 60
2.1.1 Cin´etique de l’association . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.1.2 Mise en ´evidence de la flexibilit´e des prot´eines. . . . . . . . . . . . . . . . 61
iiiTable des mati`eres
2.1.3 Comment mod´eliser cette flexibilit´e? . . . . . . . . . . . . . . . . . . . . . 63
2.2 La dynamique mol´eculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.2.1 Principe de la dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.2.2 Int´egration des trajectoires . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.2.3 Description de l’environnement . . . . . . . . . . . . . . . . . . . . . . . . 68
2.2.4 Param´etrisation du champ de forces . . . . . . . . . . . . . . . . . . . . . 70
2.2.5 Param`etres utilis´es pour les simulations de dynamique mol´eculaire . . . . 71
2.3 La dynamique mol´eculaire pour mettre en ´evidence les r´esidus en interaction . . 73
2.3.1 Erbin et la voie du TGF-β . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.3.2 Mise en ´evidence de l’interaction entre le domaine PDZ d’Erbin et le do-
maine MH2 de Smad3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.3.3 Mod´elisation du complexe PDZ d’Erbin et MH2 de Smad3 . . . . . . . . 81
2.3.4 Validation du mod`ele par mutations et charge swap . . . . . . . . . . . . 89
2.3.5 Discussions sur la validit´e du mod`ele et le rˆole d’Erbin dans la voie du
TGF-β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
2.4 La dynamique mol´eculaire pour affiner les r´esultats consensus de docking rigide . 96
2.4.1 Choix des serveurs de docking. . . . . . . . . . . . . . . . . . . . . . . . . 96
2.4.2 Comparaison des r´esultats des serveurs de docking . . . . . . . . . . . . . 98
2.4.3 Comparaison des r´esultats des serveurs a` la dynamique mol´eculaire du
mod`ele par analogie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
2.4.4 Convergence des dynamiques : mise en ´evidence d’un entonnoir ´energ´etique104
2.4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
2.5 Extensiondel’affinementdedockingrigideparsimulationscourtesdedynamique
mol´eculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.5.1 La strat´egie employ´ee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.5.2 Les r´esultats obtenus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
2.5.3 Discussion sur les r´esultats obtenus . . . . . . . . . . . . . . . . . . . . . . 119
2.6 Conclusion sur l’utilisation de la dynamique mol´eculaire en solvant explicite . . . 120
3
MetaMol : nouvelle approche pour la visualisation mol´eculaire interactive
3.1 Visualisation et interactivit´e au service de la bioinformatique structurale . . . . . 124
iv3.1.1 Une br`eve histoire de la visualisation mol´eculaire . . . . . . . . . . . . . . 124
3.1.2 Visualisation : de la mol´ecule `a la cellule . . . . . . . . . . . . . . . . . . . 125
3.1.3 Mise en place d’outils interactifs . . . . . . . . . . . . . . . . . . . . . . . 126
3.2 Metamol : visualisation haute-qualit´e de la surface mol´eculaire . . . . . . . . . . 128
3.2.1 D´efinition des diff´erents types de surfaces mol´eculaires . . . . . . . . . . . 129
3.2.2 Comparaison de la Skin Surface Mol´eculaire et la Surface Mol´eculaire . . 131
3.2.3 D´efinition et construction de la Skin Surface Mol´eculaire . . . . . . . . . 133
3.2.4 Visualisation de la Skin Surface Mol´eculaire . . . . . . . . . . . . . . . . . 138
3.2.5 Int´erˆet de notre approche pour la visualisation mol´eculaire . . . . . . . . 154
3.2.6 Discussion et futures optimisations . . . . . . . . . . . . . . . . . . . . . . 159
3.3 Conclusion : Vers un outil multi-r´esolution et interactif . . . . . . . . . . . . . . . 160
Conclusion
Annexes
A
Structure des macromol´ecules
A.0.1 Structure des prot´eines . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
A.0.2 Structure des acides nucl´eiques . . . . . . . . . . . . . . . . . . . . . . . . 171
B
Calcul de la taille de l’interface `a l’aide d’Intersurf
B.0.3 D´efinition de l’aire de l’interface . . . . . . . . . . . . . . . . . . . . . . . 177
B.0.4 Mesure de l’aire de l’interface avec Intersurf . . . . . . . . . . . . . . . . . 177
C
Calcul de la valeur de propension
D
Le pipeline graphique
E
Articles publi´es
Bibliographie 201
vTable des mati`eres
viIntroduction
Bioinformatique g´enomique et structurale
Depuis la fin des ann´ees 60 de nombreuses recherches sont men´ees a` l’aide des ordinateurs,
que cela soit pour la visualisation de mol´ecules (Levinthal, 1966), l’analyse de la structure des
prot´eines (Levitt et Chothia, 1976) ou encore la recherche d’assemblages mol´eculaires (Wodak
et Janin, 1978). Le terme le plus souvent employ´e `a cette´epoque´etait biologie computationnelle
(computational biology). Le terme bioinformatique semble, quant a` lui, avoir ´et´e utilis´e pour la
premi`ere fois en 1978 par Paulien Hogeweg lors de l’´etude de syst`eme biologique graceˆ a` l’outil
informatique.
La bioinformatique, telle que nous la connaissons actuellement, ne connut un r´eel d´evelop-
pement qu’a` la fin des ann´ees 90, ´epoque ou` “l’ordinateur personnel”(Personal Computer ou
PC) commen¸ca a` se d´emocratiser. De plus, le besoin de traiter de grands volumes de donn´ees
r´esultantdenouvellesm´ethodesexp´erimentales,commeles´equencage¸ dug´enome(Landeretthe
International Human Genome Sequencing Consortium, 2001; Venter et Celera Genomics, 2001),
les puces a` ADN (Eisen et al., 1998) ou le criblage double hybride (Uetz et al., 2000), renforca¸
ce d´eveloppement.
Il y a encore quelques ann´ees, lorsque la g´enomique ´etait en plein essor, la bioinformatique
se bornait surtout `a traiter les s´equences d’ADN : les analyser, les classer et les stocker (Collins
et al., 1998). Mais, comme cela ´etait pr´evisible, les chercheurs se rendirent rapidement compte
qu’avoir la s´equence compl`ete d’un g´enome (humain ou d’une autre esp`ece) ne suffisait pas a`
´elucider le fonctionnement biologique des cellules. Celles-ci sont, en effet, soumises a` des ph´eno-
m`enes m´etaboliques et de r´egulation qui ne sont pas directement li´es a` l’expression d’un g`ene.
C’est dans cette `ere de la post-g´enomique que la prot´eomique, l’´etude des prot´eines au sens
large, s’est d´evelopp´ee afin de r´epondre aux questions que la g´enomique ne pouvait ´elucider
(Pandey et Mann, 2000). Ces ´etudes biochimiques, souvent a` haut d´ebit, ont cr´e´e la` encore une
masse de donn´ees consid´erable. Ces donn´ees permettent de d´efinir, par exemple, quelles pro-
t´eines sont en interaction les unes avec les autres mais ne r´epondent que tr`es superficiellement a`
la question : comment? C’est pourquoi ces informations biochimiques peuvent ˆetre compl´et´ees
par des ´etudes structurales des cibles biologiques (Russell et al., 2004). Les techniques les plus
souvent utilis´ees pour ces analyses sont la cristallographie aux rayons X et la spectroscopie par
1

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi