7 jours d'essai offerts
Cet ouvrage et des milliers d'autres sont disponibles en abonnement pour 8,99€/mois




AVERTISSEMENT

Ce document est le fruit d'un long travail approuvé par le
jury de soutenance et mis à disposition de l'ensemble de la
communauté universitaire élargie.

Il est soumis à la propriété intellectuelle de l'auteur. Ceci
implique une obligation de citation et de référencement lors
de l’utilisation de ce document.

D’autre part, toute contrefaçon, plagiat, reproduction
illicite encourt une poursuite pénale.


➢ Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr




LIENS


Code de la Propriété Intellectuelle. articles L 122. 4
Code de la Propriété Intellectuelle. articles L 335.2- L 335.10
http://www.cfcopies.com/V2/leg/leg_droi.php
http://www.culture.gouv.fr/culture/infos-pratiques/droits/protection.htm ´Universit´e Henri Poincar´e - Nancy I Ecole doctorale SESAMES
UFR Sciences et techniques de la mati`ere et des proc´ed´es
Vers une nouvelle strat´egie pour
l’assemblage interactif de
macromol´ecules
`THESE
pr´esent´ee et soutenue publiquement le 30 janvier 2009
pour l’obtention du
Doctorat de l’universit´e Henri Poincar´e – Nancy 1
(sp´ecialit´e Chimie Informatique et Th´eorique)
par
Matthieu CHAVENT
Composition du jury
´Rapporteurs : Gilbert DELEAGE
Jo¨el JANIN
Examinateurs : Jean-Paul BORG
Daniel CANET
St´ephane REDON
Dave RITCHIE
´Directeurs : Bruno LEVY
Bernard MAIGRET
´Equipe ORPAILLEUR
Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
UMR 7503 - Campus Scientifique - BP 239 - 54506 Vandœuvre-les-Nancy CedexRemerciements
Je voudrais tout d’abord remercier mes co-directeurs de th`ese Bernard Maigret et Bruno
Levy. Tous les deux m’ont permis de progresser consid´erablement durant ces trois ans.
Bernard m’a fait d´ecouvrir le monde de la recherche et m’a laiss´e libre de faire mes propres
choix. Il m’a aussi permis de d´ecouvrir le monde “tout court” en m’envoyant pr´esenter mes
travaux dans diverses conf´erences autour du globe. Ceci m’a permis d’acqu´erir une certaine
pratique de l’anglais mais, surtout, de vivre des moments inoubliables (je pense en particulier a`
Fortaleza...).
J’ai ´egalement beaucoup appris avec Bruno en informatique. Il m’a montr´e qu’il fallait tou-
jours chercher `a d´epasser ses limites pour avancer... Ce ne fut pas toujours facile mais se fut une
exp´erience tr`es enrichissante. De plus, le programme MetaMol n’aurait jamais vu le jour sans
son aide pr´ecieuse et ses encouragements. Enfin, je me rappelle avec plaisir des quelques mois
pass´es dans son bureau ou` il m’a souvent fait profiter de son enthousiasme et de sa passion pour
l’informatique et le graphisme.
Je souhaite ´egalement remercier Dave Ritchie pour tous les moments agr´eables pass´es `a dis-
cuter(de“Docking”mais´egalementdetoutetderien).J’aimeraiaussileremercierpourm’avoir
permis de me lancer, avec lui, dans l’exp´erience CAPRI. J’esp`ere continuer cette collaboration
le plus longtemps possible.
Je remercie vivement les membres de mon jury d’avoir accept´e de juger mon travail; en
particulier mes rapporteurs, Jo¨el Janin et Gilbert Del´eage, d’avoir pris le temps de relire atten-
tivement mon manuscrit malgr´e des emplois du temps tr`es charg´es.
Je souhaite remercier Stephane Redon de m’avoir chaleureusement accueilli quelques jours
dans son ´equipe `a l’INRIA Grenoble - Rhone-Alpes et de m’avoir fait d´ecouvrir le programme
SAMSON.
Je remercie Jean-Paul Borg et son ´equipe sans qui le projet“Erbin”n’aurait jamais abouti.
Je souhaite tout particuli`erement remercier Nadine D´eliot pour tous les travaux qu’elle a duˆ
mettre en oeuvre pour valider mon mod`ele ainsi que pour sa relecture attentive de la partie de
ma th`ese consacr´ee aux r´esultats biologiques.
Je voudrais particuli`erement remercier Alex, avec qui j’ai pass´e des moments excellents dans
notre bureau commun et que j’esp`ere aller voir prochainement dans sa “cabane” au Canada.
Je n’oublies pas les“anciens”, JP et J´erome,ˆ qui m’ont fait d´ecouvrir phi-science dans toute sa
splendeur.
Un grand merci´egalement a` Laurent, Luc et Pilou pour leurs supports techniques qui m’ont
permis de comprendre un peu mieux les joies de l’informatiques. Je les remercie´egalement pour
les pauses caf´e (mention sp´eciale pour Laurent) et les soir´ees Chtimi (sp´eciale d´edicace a` Pilou
et sa Quack).
iJe remercie ´egalement toute l’´equipe ORPAILLEUR de m’avoir accueilli chaleureusement
et en particulier a` Amedeo Napoli, responsable de celle-ci. Une petite d´edicace pour le groupe
bioinfo Lorraine : Marie-Dominique Devignes, Malika Smaıl-Tabbone et Michel Souchet pour¨
leurs conseils (et relectures) avis´es. Je n’oublie pas non plus les survivants du bureau B235 : un
grand merci a` Yesmine et Nazhia pour leur gentillesse, leur joie de vivre et surtout leur d´elicieux
gˆateaux, L´eo pour les parties de tennis qui m’ont permis de me bouger un minimum et Vincent
pour ses aides FORTRAN et ses contributions non n´egligeables au budget caf´e.
Je tiens a` remercier´egalement les membres de l’´equipe ALICE et en particulier Nicolas Ray,
Bruno Vallet et C´ecile Poisot, pour leur discussions toujours tr`es instructives.
Je remercie ´egalement la r´egion Lorraine et le CNRS qui ont financ´e mes trois ans de th`ese
via une Bourse de Docteur Ing´enieur.
Enfin, je remercie ma famille et mes amis pour leur soutien au quotidien et plus particuli`e-
rement ma D&D qui a toujours ´et´e l`a pour moi...
iiTable des mati`eres
Introduction
1
Les assemblages macromol´eculaires : de l’analyse `a la pr´ediction
1.1 Les interactions prot´eine-acide nucl´eique . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1 Interface et g´eom´etrie des interactions . . . . . . . . . . . . . . . . . . . . 7
1.1.2 Types de r´esidus pr´esents `a l’interface et chimie de l’interaction . . . . . . 11
1.2 Les associations prot´eine-prot´eine . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 Interface et g´eom´etrie des interactions . . . . . . . . . . . . . . . . . . . . 16
1.2.2 Types de r´esidus pr´esents `a l’interface et chimie de l’interaction . . . . . . 19
1.3 Comment caract´eriser un assemblage macromol´eculaire? . . . . . . . . . . . . . . 24
1.3.1 Assemblages prot´eiques vs assemblages prot´eine-acide nucl´eique . . . . . . 24
1.3.2 Assemblages physiques vs assemblages biologiques . . . . . . . . . . . . . 27
1.3.3 Conclusion sur les associations macromol´eculaires . . . . . . . . . . . . . 29
1.4 M´ethodes in silico pour l’assemblage macromol´eculaire . . . . . . . . . . . . . . . 31
1.4.1 Les programmes d’assemblage mol´eculaire . . . . . . . . . . . . . . . . . . 31
1.4.2 Incorporation d’informations pour guider l’amarrage . . . . . . . . . . . . 41
´1.4.3 Evaluation des m´ethodes : Benchmarks et challenge CAPRI . . . . . . . . 43
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2
La dynamique mol´eculaire pour mod´eliser la flexibilit´e des assemblages
2.1 Dynamique de l’association : cin´etique et flexibilit´e . . . . . . . . . . . . . . . . . 60
2.1.1 Cin´etique de l’association . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.1.2 Mise en ´evidence de la flexibilit´e des prot´eines. . . . . . . . . . . . . . . . 61
iiiTable des mati`eres
2.1.3 Comment mod´eliser cette flexibilit´e? . . . . . . . . . . . . . . . . . . . . . 63
2.2 La dynamique mol´eculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.2.1 Principe de la dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.2.2 Int´egration des trajectoires . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.2.3 Description de l’environnement . . . . . . . . . . . . . . . . . . . . . . . . 68
2.2.4 Param´etrisation du champ de forces . . . . . . . . . . . . . . . . . . . . . 70
2.2.5 Param`etres utilis´es pour les simulations de dynamique mol´eculaire . . . . 71
2.3 La dynamique mol´eculaire pour mettre en ´evidence les r´esidus en interaction . . 73
2.3.1 Erbin et la voie du TGF-β . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.3.2 Mise en ´evidence de l’interaction entre le domaine PDZ d’Erbin et le do-
maine MH2 de Smad3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.3.3 Mod´elisation du complexe PDZ d’Erbin et MH2 de Smad3 . . . . . . . . 81
2.3.4 Validation du mod`ele par mutations et charge swap . . . . . . . . . . . . 89
2.3.5 Discussions sur la validit´e du mod`ele et le rˆole d’Erbin dans la voie du
TGF-β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
2.4 La dynamique mol´eculaire pour affiner les r´esultats consensus de docking rigide . 96
2.4.1 Choix des serveurs de docking. . . . . . . . . . . . . . . . . . . . . . . . . 96
2.4.2 Comparaison des r´esultats des serveurs de docking . . . . . . . . . . . . . 98
2.4.3 Comparaison des r´esultats des serveurs a` la dynamique mol´eculaire du
mod`ele par analogie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
2.4.4 Convergence des dynamiques : mise en ´evidence d’un entonnoir ´energ´etique104
2.4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
2.5 Extensiondel’affinementdedockingrigideparsimulationscourtesdedynamique
mol´eculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.5.1 La strat´egie employ´ee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.5.2 Les r´esultats obtenus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
2.5.3 Discussion sur les r´esultats obtenus . . . . . . . . . . . . . . . . . . . . . . 119
2.6 Conclusion sur l’utilisation de la dynamique mol´eculaire en solvant explicite . . . 120
3
MetaMol : nouvelle approche pour la visualisation mol´eculaire interactive
3.1 Visualisation et interactivit´e au service de la bioinformatique structurale . . . . . 124
iv3.1.1 Une br`eve histoire de la visualisation mol´eculaire . . . . . . . . . . . . . . 124
3.1.2 Visualisation : de la mol´ecule `a la cellule . . . . . . . . . . . . . . . . . . . 125
3.1.3 Mise en place d’outils interactifs . . . . . . . . . . . . . . . . . . . . . . . 126
3.2 Metamol : visualisation haute-qualit´e de la surface mol´eculaire . . . . . . . . . . 128
3.2.1 D´efinition des diff´erents types de surfaces mol´eculaires . . . . . . . . . . . 129
3.2.2 Comparaison de la Skin Surface Mol´eculaire et la Surface Mol´eculaire . . 131
3.2.3 D´efinition et construction de la Skin Surface Mol´eculaire . . . . . . . . . 133
3.2.4 Visualisation de la Skin Surface Mol´eculaire . . . . . . . . . . . . . . . . . 138
3.2.5 Int´erˆet de notre approche pour la visualisation mol´eculaire . . . . . . . . 154
3.2.6 Discussion et futures optimisations . . . . . . . . . . . . . . . . . . . . . . 159
3.3 Conclusion : Vers un outil multi-r´esolution et interactif . . . . . . . . . . . . . . . 160
Conclusion
Annexes
A
Structure des macromol´ecules
A.0.1 Structure des prot´eines . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
A.0.2 Structure des acides nucl´eiques . . . . . . . . . . . . . . . . . . . . . . . . 171
B
Calcul de la taille de l’interface `a l’aide d’Intersurf
B.0.3 D´efinition de l’aire de l’interface . . . . . . . . . . . . . . . . . . . . . . . 177
B.0.4 Mesure de l’aire de l’interface avec Intersurf . . . . . . . . . . . . . . . . . 177
C
Calcul de la valeur de propension
D
Le pipeline graphique
E
Articles publi´es
Bibliographie 201
vTable des mati`eres
viIntroduction
Bioinformatique g´enomique et structurale
Depuis la fin des ann´ees 60 de nombreuses recherches sont men´ees a` l’aide des ordinateurs,
que cela soit pour la visualisation de mol´ecules (Levinthal, 1966), l’analyse de la structure des
prot´eines (Levitt et Chothia, 1976) ou encore la recherche d’assemblages mol´eculaires (Wodak
et Janin, 1978). Le terme le plus souvent employ´e `a cette´epoque´etait biologie computationnelle
(computational biology). Le terme bioinformatique semble, quant a` lui, avoir ´et´e utilis´e pour la
premi`ere fois en 1978 par Paulien Hogeweg lors de l’´etude de syst`eme biologique graceˆ a` l’outil
informatique.
La bioinformatique, telle que nous la connaissons actuellement, ne connut un r´eel d´evelop-
pement qu’a` la fin des ann´ees 90, ´epoque ou` “l’ordinateur personnel”(Personal Computer ou
PC) commen¸ca a` se d´emocratiser. De plus, le besoin de traiter de grands volumes de donn´ees
r´esultantdenouvellesm´ethodesexp´erimentales,commeles´equencage¸ dug´enome(Landeretthe
International Human Genome Sequencing Consortium, 2001; Venter et Celera Genomics, 2001),
les puces a` ADN (Eisen et al., 1998) ou le criblage double hybride (Uetz et al., 2000), renforca¸
ce d´eveloppement.
Il y a encore quelques ann´ees, lorsque la g´enomique ´etait en plein essor, la bioinformatique
se bornait surtout `a traiter les s´equences d’ADN : les analyser, les classer et les stocker (Collins
et al., 1998). Mais, comme cela ´etait pr´evisible, les chercheurs se rendirent rapidement compte
qu’avoir la s´equence compl`ete d’un g´enome (humain ou d’une autre esp`ece) ne suffisait pas a`
´elucider le fonctionnement biologique des cellules. Celles-ci sont, en effet, soumises a` des ph´eno-
m`enes m´etaboliques et de r´egulation qui ne sont pas directement li´es a` l’expression d’un g`ene.
C’est dans cette `ere de la post-g´enomique que la prot´eomique, l’´etude des prot´eines au sens
large, s’est d´evelopp´ee afin de r´epondre aux questions que la g´enomique ne pouvait ´elucider
(Pandey et Mann, 2000). Ces ´etudes biochimiques, souvent a` haut d´ebit, ont cr´e´e la` encore une
masse de donn´ees consid´erable. Ces donn´ees permettent de d´efinir, par exemple, quelles pro-
t´eines sont en interaction les unes avec les autres mais ne r´epondent que tr`es superficiellement a`
la question : comment? C’est pourquoi ces informations biochimiques peuvent ˆetre compl´et´ees
par des ´etudes structurales des cibles biologiques (Russell et al., 2004). Les techniques les plus
souvent utilis´ees pour ces analyses sont la cristallographie aux rayons X et la spectroscopie par
1