La lecture à portée de main
Découvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDécouvre YouScribe en t'inscrivant gratuitement
Je m'inscrisSujets
Informations
Publié par | technische_universitat_munchen |
Publié le | 01 janvier 2008 |
Nombre de lectures | 29 |
Langue | Deutsch |
Poids de l'ouvrage | 19 Mo |
Extrait
TECHNISCHE UNIVERSITÄT MÜNCHEN
Fachgebiet für Genomorientierte Bioinformatik
Comparative proteomics – methods and applications
Thorsten Sven-Olaf Schmidt
Vollständiger Abdruck der von der Fakultät Wissenschaftszentrum Weihenstephan
für Ernährung, Landnutzung und Umwelt der Technischen Universität München zur
Erlangung des akademischen Grades eines
Doktor der Naturwissenschaften
genehmigten Dissertation.
Vorsitzender: Univ.-Prof. B. Küster, Ph.D.
Prüfer der Dissertation: 1. Univ.-Prof. Dr. D. Frischmann
2. Univ.-Prof. Dr. H.-W. Mewes
3. Univ.-Prof. Dr. J. Parsch,
(Ludwig-Maximilians-Universität München)
Die Dissertation wurde am 19.6.2008 bei der Technischen Universität München
eingereicht und durch die Fakultät Wissenschaftszentrum Weihenstephan für
Ernährung, Landnutzung und Umwelt am 23.10.2008 angenommen.
Table of Contents
ZUSAMMENFASSUNG ........................................................................................................... IV
CHAPTER 1 MOTIVATION AND OVERVIEW ................................................................... 6
1.1 GENOME SEQUENCING AND ANNOTATION ............................................................................ 7
1.2 PROTEOMIC MEASUREMENTS ............................................................................................... 8
1.3 GENOME STRUCTURE9
1.4 COMPARATIVE GENOMICS AND PROTEOMICS IN THE SPACE OF GENE ATTRIBUTES ............. 10
1.5 LACK OF SOFTWARE TOOLS ................................................................................................ 12
1.6 THESIS OUTLINE ................................................................................................................. 13
CHAPTER 2 DATA INTEGRATION, MAPPING AND STATISTICAL ANALYSES ... 15
2.1 PROMPT – PROTEIN MAPPING AND COMPARISON ............................................................ 15
2.1.1 Introduction ............................................................................................................... 15
2.1.2 Material and Methods ............................................................................................... 16
2.1.3 Applications ... 32
2.1.4 Discussion ................................................................................................................. 39
2.2 INTEGRATION OF FUNCTIONAL AND PHYSICAL ANNOTATIONS ............................................ 40
2.2.1 Introduction ... 40
2.2.2 Material and Methods ............................................................................................... 41
2.2.3 Results ....................................................................................................................... 43
CHAPTER 3 APPLICATIONS IN COMPARATIVE PROTEOMICS ............................. 45
3.1 DATABASES AND RETRIEVAL SYSTEMS .............................................................................. 45
3.1.1 PEDANT-Webservices ............................................................................................... 45
3.1.2 CORUM- Search and EJB accession ........................................................................ 50
3.2 COMPARATIVE ANALYSES FOR STRUCTURAL BIOINFORMATICS .......................................... 52
3.2.1 Background ............................................................................................................... 52
3.2.2 Material and Methods 53
3.2.3 Results ....................................................................................................................... 56
ii
3.3 COMPLEX FUNCTIONAL PROFILING OF PROTEIN AND GENE SETS ......................................... 57
3.3.1 Introduction ............................................................................................................... 57
3.3.2 Methods and Implementation .................................................................................... 58
3.3.3 Results ....................................................................................................................... 59
3.3.4 Discussion ................................................................................................................. 64
CHAPTER 4 GENE AND PROTEIN EXPRESSION .......................................................... 65
4.1 ABUNDANCE PROFILING OF THE E.COLI PROTEOME ............................................................ 65
4.1.1 Introduction ... 65
4.1.2 Material and Methods ............................................................................................... 66
4.1.3 Results ....................................................................................................................... 72
4.1.4 Discussion ................................................................................................................. 87
4.2 GENOME ARCHITECTURES AND EVALUATION ..................................................................... 88
4.2.1 Introduction ............................................................................................................... 88
4.2.2 Material and Methods 89
4.2.3 Results ...... 93
4.2.4 Discussion . 109
CHAPTER 5 CONCLUSIONS AND FUTURE WORK .................................................... 110
SUMMARY .............................................................................................................................. 111
LIST OF TABLES ................................................................................................................... 113
LIST OF FIGURES ................................................................................................................. 114
BIBLIOGRAPHY .................................................................................................................... 116
ACKNOWLEDGEMENTS ..................................................................................................... 130
APPENDIX ............................................................................................................................... 131
PUBLICATIONS ....................................................................................................................... 131
TEACHING EXERCISES ............................................................................................................ 135
CURRICULUM VITAE ............................................................................................................... 137
iii
Zusammenfassung
Schwerpunkt dieser Arbeit ist die Entwicklung von Bioinformatikmethoden sowie
deren Anwendung in der vergleichenden Proteomik. Dabei werden die hier neu
entwickelten Methoden (Schmidt and Frishman 2006; Antonov, Schmidt et al.
2008; Schmidt and Frishman 2008) auf biologische Fragestellungen angewandt und
die Ergebnisse präsentiert (Riley, Schmidt et al. 2005; Schmidt and Frishman 2006;
Smialowski, Schmidt et al. 2006; Riley, Schmidt et al. 2007; Ruepp, Brauner et al.
2007; Schmidt, Hombach et al. 2007; Antonov, Schmidt et al. 2008; Irmler, Hartl et
al. 2008; Ishihama, Schmidt et al. 2008; Schmidt and Frishman 2008). Die Arbeit
gliedert sich – neben einer Einführung und Hintergrundinformation in Kapitel eins -
in drei thematische Abschnitte:
Kapitel zwei stellt das PROMPT Framework zur vergleichenden Analyse von
biologischen Daten insbesondere aus dem Gebiet der Genomik und Proteomik
(Schmidt and Frishman 2006) vor. Dabei werden für das häufige Problem der
korrekten Zuordnung von Identifiern (dem sogenannten Mapping) sowie für die
Integration von funktionellen, strukturellen und weiteren Proteineigenschaften neu
entwickelte Lösungen und deren Nutzen präsentiert (Irmler, Hartl et al. 2008;
Ishihama, Schmidt et al. 2008).
Um die volle Mächtigkeit der in dieser Arbeit entwickelten, evaluierten und
angewandten Methoden nutzen zu können, ist eine solide Datenbasis unabdingbar.
Zusätzlich werden daher im Rahmen dieser Arbeit Datenbanken und Retrieval
Systeme, basierend auf Web Service und J2EE Technologien, entwickelt und
vorgestellt (Riley, Schmidt et al. 2005; Riley, Schmidt et al. 2007; Ruepp, Brauner
et al. 2007). Kapitel drei gibt hierzu eine kurze Übersicht. Darüber hinaus wird in
Kapitel drei demonstriert, wie mittels der eingeführten Datenbanksysteme im
Zusammenspiel mit den vorgestellten Methoden - komplexe Funktionen besser
beschrieben werden können (Antonov, Schmidt et al. 2008) und ein prediktives
Modell hinsichtlich Proteinkristallisierbarkeit erstellt werden kann (Smialowski,
Schmidt et al. 2006).
In Kapitel vier werden die entwickelten Methoden erstmals in großem Umfang auf
Protein-Abundanz Daten angewandt. Im ersten Teil von Kapitel vier werden neue
biologische Erkenntnisse im Hinblick auf Funktion, Struktur und weiterer Aspekte
in E.coli vorgestellt (Ishihama, Schmidt et al. 2008).
iv
Im zweiten Teil von Kapitel vier, wird darüber hinaus die zugrunde liegende
Genomarchitektur von höheren Eukaryoten analysiert. Dabei konnten nicht nur
Gemeinsamkeiten und Unterschiede zwischen Organismen und Methoden gezeigt
werden (Schmidt, Hombach