présentée pour l'obtention du grade de

De
Publié par

Niveau: Supérieur, Doctorat, Bac+8
THESE présentée pour l'obtention du grade de DOCTEUR DE L'UNIVERSITE LOUIS PASTEUR DE STRASBOURG Par Christine CARAPITO Vers une meilleure utilisation des données de spectrométrie de masse en analyse protéomique Soutenue le 17 novembre 2006 devant la commission d'examen : Dr. Alain VAN DORSSELAER Directeur de thèse Dr. Emmanuelle LEIZE Co-directeur de thèse Prof. Claude KEDINGER Président et rapporteur interne Dr. Jérôme GARIN Rapporteur externe Prof. Arnaud DUCRUIX Rapporteur externe

  • outils au service de l'analyse pr

  • ms dans le génome complet

  • recherches dans le génome complet pour la discrimination des gènes paralogues

  • temps au temps

  • système nanohplc-chip

  • données nanolc-ms

  • stratégie de la recherche


Publié le : mercredi 1 novembre 2006
Lecture(s) : 173
Source : scd-theses.u-strasbg.fr
Nombre de pages : 218
Voir plus Voir moins


THESE





présentée pour l’obtention du grade de


DOCTEUR DE L’UNIVERSITE LOUIS PASTEUR

DE STRASBOURG


Par


Christine CARAPITO




Vers une meilleure utilisation des données de
spectrométrie de masse en analyse protéomique











Soutenue le 17 novembre 2006 devant la commission d’examen :

Dr. Alain VAN DORSSELAER Directeur de thèse
Dr. Emmanuelle LEIZE Co-directeur de thèse
Prof. Claude KEDINGER Président et rapporteur interne
Dr. Jérôme GARIN Rapporteur externe
Prof. Arnaud DUCRUIX













































Thèse accessible en ligne au service commun de documentation de l’Université Louis
Pasteur de Strasbourg :
http://eprints-scd-ulp.u-strasbg.fr/theses/theses.html










A mes parents,





















« L'éducation est une chose admirable, mais il est bon de se souvenir de temps
en temps que rien de ce qui est digne d'être connu ne peut s'enseigner. »
Oscar Wilde Merci !

Ce travail de thèse a été réalisé au Laboratoire de Spectrométrie de Masse
BioOrganique de l’Institut Pluridisciplinaire Hubert Curien de Strasbourg (UMR 7178,
CNRS-ULP).

Je souhaite en premier lieu adresser ma profonde reconnaissance à Alain Van
Dorsselaer pour m’avoir accueillie dans son laboratoire, pour m’avoir offert un cadre de
travail « de rêve » et surtout pour sa présence, son soutien et la confiance qu’il m’a
accordés. Mes plus vifs remerciements vont également à Emmanuelle Leize pour son
encadrement, ses encouragements et sa confiance.

J’adresse mes vifs remerciements à Monsieur Claude Kédinger qui a accepté de
présider mon jury de thèse ainsi qu’à Messieurs Jérôme Garin et Arnaud Ducruix,
rapporteurs externes, qui ont consacré de leur temps à l’évaluation de ce travail.

Je remercie également l’ensemble des personnes avec lesquelles j’ai été amenée à
collaborer et qui m’ont entraînée dans des thématiques aussi diverses que passionnantes,
dans le désordre : J.P. Brizard et C. Brugidou, A. Castro et C. Clément, D. Muller et P.
Bertin, V. Phalip et J.M. Jeltsch, R. Bernhardt, Susanne, Hoon et Britta, M. Schöller, N.
Bühr et S. Viville, J.F. Launay, H. Ludwig et L. Bode, P. Cailliéret et M. Gobert, …

J’adresse mes chaleureux remerciements au CNRS et à la société Bruker Daltonics
pour le financement de cette thèse.

Un grand merci à tous ceux avec qui j’ai partagé ces trois années au LSMBO pour les
échanges, l’ambiance et la bonne humeur : Agnès, Andy, Audrey, Cédric, Christelle,
Christine, Danièle, Dimitri, Elsa, Fabrice B., Fabrice V., Flavie, Grand Fred, Guillaume B.,
Guillaume C., Haiko, Hélène, Jean-Marc, Jonathan, Laetitia, Laurent, Marie-Laure,
Nathalie, Noëlle, Ptit Fred, Raymond, Rossella, Sarah, Sébastien, Sophie, Véronique T.,
Véronique D., Virginie, …

Un grand merci à mon entourage et mes proches amis.

Un immense merci à ma « garde rapprochée », à mes plus fidèles supporters pour
leur présence et leur amour, à savoir mes grands frères et mes parents.

Et enfin, mes plus affectueux remerciements à mon cher binôme et soutien
quotidien.
PLAN GENERAL


PRESENTATION DE CE TRAVAIL DE THESE ................................................................................................1
INTRODUCTION BIBLIOGRAPHIQUE
Des débuts de la protéomique aux défis actuels
Introduction et définitions ...............................................................................................................................5
Chapitre I : Les outils au service de l’analyse protéomique.............................................................................7
Chapitre II : Les stratégies d’identification en analyse protéomique et les nouveaux défis............................41
Conclusion.......................54
RESULTATS

PARTIE I : Amélioration de la prise de données MS/MS

Chapitre I : Le couplage nanoHPLC-trappe ionique ......................................................................................67
Chapitre II : Les nouveautés instrumentales du couplage : le système nanoHPLC-Chip Cube et la
fragmentation ETD .....................................................................................................................79
PARTIE II : Applications portant sur des organismes dont le génome est
séquencé et bien annoté

Chapitre I : Une carte protéomique de référence et étude différentielle de l’effet d’un
minéralocorticoïde, l’aldostérone chez Schizosaccharomyces pombe......................................99
Chapitre II : Etude de l’exoprotéome du champignon filamenteux Fusarium graminearum se
développant sur des parois de houblon ...................................................................................107
Chapitre III : Etude de l’interactome virus-protéines hôtes recrutées lors de l’infection du riz par le
virus de la Panachure Jaune du Riz.........................................................................................111
PARTIE III : Applications portant sur des organismes non séquencés : le
séquençage de novo

Chapitre I : L’identification des protéines par séquençage de novo ...........................................................122
Chapitre II : Identification des protéines impliquées dans la résistance à l’arsenic chez la bactérie
Caenibacter arsenoxydans........................................................................................................134
Chapitre III : Analyse protéomique de tissus de vigne (Vitis vinifera L.) ayant subi un stress herbicide ......138
PARTIE IV : Applications des recherches de données nanoLC-MS/MS dans des
génomes complets non annotés

Chapitre I : Une stratégie de recherche avec des données nanoLC-MS/MS dans le génome complet
non annoté .................................................................................................................................144
Chapitre II : Les recherches dans les génomes : un outil d’aide à l’annotation des génomes
bactériens ..................................................................................................................................154
Chapitre III : Les recherches dans le génome complet pour la discrimination des gènes paralogues au
sein de grandes familles multigéniques...................................................................................167


CONCLUSION GENERALE ...........................................................................................................................178

PLAN DETAILLE

PRESENTATION DE CE TRAVAIL DE THESE..............................1

INTRODUCTION BIBLIOGRAPHIQUE
Des débuts de la protéomique aux défis actuels
Introduction et définitions.............................................................................5
Chapitre I : Les outils au service de l’analyse protéomique......................7
1 Les outils de la spectrométrie de masse................................................................................8
1.1 Les sources d’ionisation ESI et MALDI ...........................................................................8
1.1.1 La source Electrospray...........................................................................................8
1.1.2 La source nano-electrospray ou nanospray (nano-ESI).......................................11
1.1.3 La source MALDI..................................................................................................11
1.2 Les analyseurs..............................................................................................................12
1.2.1 L’analyseur quadripôlaire (Q) ...............................................................................13
1.2.2 L’analyseur à temps de vol (TOF) ........................................................................14
1.2.3 L’analyseur trappe ionique (IT).............................................................................15
1.2.4 Des analyseurs en tandem : l’exemple du Q-TOF ...............................................21
1.3 La fragmentation peptidique..........................................................................................22
1.4 Conclusions...................................................................................................................25
2 Les techniques de séparation des protéines et peptides .....................................................26
2.1 Le gel d’électrophorèse bidimensionnel (gel 2D) ..........................................................26
2.1.1 Principe et colorations26
2.1.2 Les limitations du gel 2D ......................................................................................27
2.2 La chromatographie liquide (LC) et les alternatives au gel 2D......................................28
2.2.1 Le gel SDS PAGE (gel 1D) couplé à la nanoLC...................................................28
2.2.2 Les techniques de chromatographie liquide multidimensionnelle ........................29
2.3 Conclusions...................................................................................................................31
3 Le séquençage des génomes et les banques de données de séquence ............................32
3.1 omes .......................................................................................32
3.1.1 Le séquençage de l’ADN32
3.1.2 Les stratégies de séquençage des génomes.......................................................33
3.2 Les banques de données de séquence ........................................................................34
3.2.1 Les banques de séquences nucléotidiques..........................................................35
3.2.2 s protéiques37
3.3 Conclusions...39
Chapitre II : Les stratégies d’identification en analyse protéomique
et les nouveaux défis.............................................................41
1 Les stratégies d’identification des protéines en analyse protéomique .................................41
1.1 Historique......................................................................................................................41
1.2 L’empreinte peptidique massique (PMF).......................................................................42
1.2.1 Les identifications par PMF ..................................................................................42
1.2.2 Les limites du PMF...............................................................................................43
1.3 Les approches par nanoLC-MS/MS ..............................................................................44
1.3.1 Les moteurs de recherche en banques de données ............................................44
1.3.2 Les limites des algorithmes de recherche dans les banques de données et les outils de validation..........................................................................................47
1.3.3 Les approches par séquençage de novo .............................................................47
1.4 L’importance du choix de la banque de données utilisée pour les recherches .............48
1.5 Les directives de publication des données de protéomique.........................................49
1.6 Conclusions...................................................................................................................50
2 Les nouveaux défis en protéomique ....................................................................................50
2.1 Les stratégies de quantification.....................................................................................50
2.2 La caractérisation des modifications post-traductionnelles (PTM) ................................52
3 Conclusions..........................................................................................................................53
Conclusion .................................................................................................54
Bibliographie ................................................................................................56

RESULTATS

PARTIE I : Amélioration de la prise de données MS/MS
Chapitre I : Le couplage nanoHPLC-trappe ionique .................................67
1 La trappe HCTPlus...............................................................................................................67
1.1 Optimisations des paramètres d’acquisition de la trappe..............................................67
1.1.1 Le cut-off ou la limite inférieure de piégeage des ions .........................................67
1.1.2 Les phénomènes d’espace-charge et le réglage de l’ICC dans la trappe (Ion
Charge Control)....................................................................................................69
1.1.3 Le choix du mode de balayage.............................................................................70
1.2 La MS/MS sur les trappes HCTPlus..............................................................................71
2 Le couplage nanoLC-MS/MS ...............................................................................................72
2.1 Configuration du système..............................................................................................72
2.2 Optimisation des gradients de chromatographie...........................................................73
2.3 Optimisation des paramètres d’acquisition en mode MS-MS/MS automatique.............75
2.3.1 Les cycles d’acquisition en mode MS-MS/MS automatique.................................75
2.3.2 Le mode SPS (Smart Parameter Setting) ............................................................76
2.3.3 Le seuil de sélection des ions parents et l’exclusion temporaire..........................76
2.3.4 Le choix des ions parents sélectionnés pour la MS/MS .......................................77
2.3.5 Le mode de balayage...........................................................................................77
2.3.6 Le nombre de spectres moyennés .......................................................................77
2.3.7 Détail sur la durée d’acquisition d’un cycle MS-MS/MS78
3 Conclusions..........................................................................................................................78
Chapitre II : Les nouveautés instrumentales du couplage : le
système nanoHPLC-Chip Cube et la fragmentation ETD ...79
1 Le système nanoHPLC-Chip Cube ......................................................................................79
1.1 Configuration du système..............................................................................................79
1.1.1 L’interface nanoHPLC-Chip cube.........................................................................79
1.1.2 Les différentes chips disponibles..........................................................................80
1.1.3 La traçabilité des chips.........................................................................................80
1.1.4 La configuration du balayage de la pré-colonne...................................................80
1.2 Optimisation des gradients............................................................................................81
1.3 Des temps d’analyse plus courts donc adaptation de l’acquisition MS-MS/MS ............82
1.4 Evaluation de la sensibilité du système83
1.5 La reproductibilité du système.......................................................................................84
1.6 Avantages et limites du système...................................................................................84
1.6.1 Les avantages......................................................................................................84
1.6.2 Les limites.............................................................................................................85
1.7 Conclusions...................................................................................................................87
2 La dissociation par transfert d’électron (ETD)......................................................................88
2.1 Le principe de l’ETD et configuration de la trappe HCTUltra PTM Discovery
System ..........................................................................................................................88
2.2 Les premiers résultats obtenus .....................................................................................90
2.2.1 La fragmentation de peptides trypsiques : comparaison CID-ETD ......................90
2.2.2 Les analyses nanoLC-MS/MS avec la fragmentation ETD ..................................91
2.2.3 La détermination des sites de phosphorylation ....................................................91
2.2.4 Essais sur des grands peptides et protéines........................................................92
2.3 Quelques astuces d’optimisation du signal et de la fragmentation................................94
2.3.1 La quantité d’anions fluorenthène accumulés dans la trappe ..............................94
2.3.2 Le temps de réaction dans l’analyseur.................................................................94
2.3.3 Le cut-off de l’ETD................................................................................................94
2.3.4 Les modes “smart decomposition” et le “tickling” des ions...................................95
2.4 Les limites du système ..................................................................................................96
2.4.1 La perte de sensibilité...........................................................................................96
2.4.2 Les difficultés d’interprétation des spectres..........................................................96
2.5 Conclusions...................................................................................................................96
Bibliographie97

PARTIE II : Applications portant sur des organismes dont le
génome est séquencé et bien annoté
Chapitre I : Une carte protéomique de référence et étude
différentielle de l’effet d’un minéralocorticoïde,
l’aldostérone, chez Schizosaccharomyces pombe.............99
1 Etablissement d’une carte protéomique de référence pour Schizosaccharomyces
pombe..................................................................................................................................99
1.1 Contexte de cette étude ................................................................................................99
1.1.1 Schizosaccharomyces pombe, un système modèle.............................................99
1.1.2 Le génome et le protéome de S. pombe ............................................................100
1.1.3 Objectif de l’étude...............................................................................................100
1.2 Choix de la stratégie expérimentale mise en oeuvre...................................................100
1.2.1 Préparation des échantillons ..............................................................................100
1.2.2 Analyse par spectrométrie de masse .................................................................101
1.2.3 Stratégie d’identification des protéines...............................................................101
1.3 Résultats publiés.........................................................................................................101
1.4 Conclusions et perspectives........................................................................................102

Publication: Proteome analysis of Schizosaccharomyces pombe by two-dimensional gel
electrophoresis and mass spectrometry.
* * Hwang KH , Carapito C, Böhmer S, Leize E, Van Dorsselaer A, Bernhardt R.
Proteomics, 6, 4115-4128.
2 Etude différentielle de l’effet d’un minéralocorticoïde : l’aldostérone .................................103
2.1 Contexte de cette étude ..............................................................................................103
2.1.1 L’aldostérone......................................................................................................103
2.1.2 Choix du modèle d’étude S. pombe ...................................................................
2.1.3 Objectif de l’étude...............................................................................................103
2.2 Choix de la stratégie expérimentale mise en oeuvre...................................................104 2.2.1 Préparation des échantillons ..............................................................................104
2.2.2 Analyse par spectrométrie de masse .................................................................104
2.2.3 Stratégie d’identification des protéines...............................................................104
2.3 Résultats publiés.........................................................................................................105
2.4 Conclusions et perspectives........................................................................................105

Publication: Analysis of aldosterone induced differential receptor-independent protein
patterns using 2D-electrophoresis and mass spectrometry.
Böhmer S, Carapito C, Leize E, Van Dorsselaer A, Bernhardt R. Biol. Chem., 367,
917-929.
Chapitre II : Etude de l’exoprotéome du champignon filamenteux
Fusarium graminearum se développant sur des parois
de houblon............................................................................107
1 Contexte de cette étude .....................................................................................................107
1.1 L’interaction hôte-pathogène : le modèle Humulus lupulus / Fusarium graminearum.107
1.2 Le génome et le protéome de Fusarium graminearum ...............................................108
1.3 Objectif de l’étude........................................................................................................108
2 Choix de la stratégie expérimentale mise en oeuvre .........................................................109
2.1 Préparation des échantillons .......................................................................................109
2.2 Analyse par spectrométrie de masse ..........................................................................109
2.3 Stratégie d’identification des protéines........................................................................109
3 Résultats publiés................................................................................................................110
4 Conclusions et perspectives du travail...............................................................................110

Publication: Diversity of the exoproteome of Fusarium graminearum grown on plant cell
wall.
Phalip V, Delalande F, Carapito C, Goubet F, Hatsch D, Leize-Wagner E, Dupree P,
Van Dorsselaer A, Jeltsch JM. Curr Genet, 48, 366-379.
Chapitre III : Etude de l’interactome virus-protéines hôtes recrutées
lors de l’infection du riz par le virus de la Panachure
Jaune du Riz .........................................................................111
1 Contexte de cette étude .....................................................................................................111
1.1 L’interaction virus-protéines hôtes : RYMV/Oryza sativa ............................................111
1.1.1 Oryza sativa et ses agents pathogènes .............................................................111
1.1.2 Le virus RYMV (Rice Yellow Mottle Virus) .........................................................112
1.1.3 L’interaction virus-protéines hôtes......................................................................113
1.2 Le génome et le protéome d’Oryza sativa...................................................................113
1.3 Objectif de l'étude........................................................................................................114
2 Choix de la stratégie expérimentale mise en oeuvre114
2.1 Préparation des échantillons .......................................................................................114
2.2 Analyse par spectrométrie de masse ..........................................................................114
2.3 Stratégie d’identification des protéines........................................................................115
3 Résultats publiés................................................................................................................115
4 Conclusion et perspectives................................................................................................117
Bibliographie ..............................................................................................118

PARTIE III : Applications portant sur des organismes non
séquencés : le séquençage de novo
Chapitre I : L’identification des protéines par séquençage de novo ....122
1 Pourquoi le recours au séquençage de novo ?..................................................................122
1.1 Limites des moteurs de recherche classique pour l’étude des organismes non
séquencés ...................................................................................................................122
1.2 Le séquençage de novo et les identifications inter-espèces par recherche de
similarités de séquences .............................................................................................123
1.3 Les difficultés et contraintes de cette approche ..........................................................125
2 Les outils informatiques .....................................................................................................125
2.1 Les logiciels d’aide à l’interprétation des spectres par séquençage de novo..............125
2.2 Evaluation de ces outils...............................................................................................126
2.2.1 L’outil peigne de DataAnalysis ...........................................................................126
2.2.2 Les outils de traitement spectres à spectres, traitement semi-automatisé :
RapidDeNovo (Bruker Daltonics), PepSeq (Waters) .........................................126
2.2.3 Le logiciel PEAKS Studio (Bioinformatics Solutions)..........................................127
2.3 Le MS-BLAST, un outil adapté pour les données de spectrométrie de masse en
tandem ........................................................................................................................129
2.4 Automatisation des étapes de la stratégie par des scripts129
3 Le séquençage de novo sur les instruments de type trappe ionique .................................130
4 Conclusions........................................................................................................................133
Chapitre II : Identification des protéines impliquées dans la
résistance à l’arsenic chez la bactérie Caenibacter
arsenoxydans .......................................................................134
1 Contexte de cette étude .....................................................................................................134
1.1 Caenibacter arsenoxydans et sa résistance à l’arsenic ..............................................134
1.2 Le génome et le protéome de la bactérie....................................................................135
1.3 Objectif de l’étude........................................................................................................135
2 Choix de la stratégie expérimentale mise en œuvre..........................................................135
2.1 Préparation des échantillons .......................................................................................135
2.2 Analyse par spectrométrie de masse ..........................................................................136
2.3 Stratégie d’identification des protéines........................................................................136
3 Résultats publiés................................................................................................................136
4 Conclusions et perspectives du travail...............................................................................137

Publication : Identification of genes and proteins involved in the pleiotropic response to
arsenic stress of Caenibacter arsenoxydans, a metalloresistant
betaproteobacterium with an unsequenced genome.
Carapito C, Muller D, Turlin E, Koechler S, Danchin A, Van Dorsselaer A,
LeizeWagner E, Bertin PN, Lett MC, Biochimie, 88, 595-606.
Chapitre III : Analyse protéomique de tissus de vigne (Vitis vinifera
L.) ayant subi un stress herbicide ......................................138
1 Contexte de cette étude .....................................................................................................138
1.1 Vitis vinifera et l’herbicide Flumioxazin (fmx)...............................................................138
1.2 Le génome et le protéome de Vitis vinifera .................................................................139
1.3 Objectif de l’étude........................................................................................................139
2 Choix de la stratégie expérimentale mise en œuvre..........................................................139
2.1 Préparation des échantillons .......................................................................................139
2.2 Analyse par spectrométrie de masse ..........................................................................140
2.3 Stratégie d’identification des protéines........................................................................140

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.