A phylogenetic potpourri [Elektronische Ressource] : computational methods for analysing genome scale data / vorgelegt von Alexander F. Auch

De
A phylogenetic potpourriComputational methods for analysinggenome-scale dataDissertationder Fakultat fur Informations- und Kognitionswissenschaften der Eberhard-Karls-Universitat Tubingen zur Erlangung des Grades einesDoktors der Naturwissenschaften(Dr. rer. nat.)vorgelegt vonDipl.-Inform. Alexander F. Auchaus StuttgartTubingen2009Tag der mundlic hen Quali kation: 13.01.2010Dekan: Prof. Dr. Oliver Kohlbacher1. Berichterstatter: Prof. Dr. Daniel H. Huson2. Berichterstatter: Dr. Alexandros StamatakisThe Exelixis LabTechnische Universitat Munc henErklarungHiermit erklare ich, da ich diese Schrift selbst andig und nur mit den ange- gebenen Hilfsmitteln angefertigt habe und da alle Stellen, die im Wortlautoder dem Sinne nach anderen Werken entnommen sind, durch Angaben derQuellen kenntlich gemacht sind. Eine detaillierte Abgrenzung meiner eige-nen Leistungen von den Beitragen meiner Kooperationspartner und von Im-plementierungsleistungen, die im Rahmen von mir betreuter Studien- undDiplomarbeiten erbracht worden sind, habe ich explizit in Anhang B vorge-nommen.Tubingen, September 2009 Alexander AuchivZusammenfassungSeit den Anfangen der Erforschung evolutionarer Prozesse gilt das Bestre- ben dieser Disziplin der Rekonstruktion eines moglic hst wirklichkeitsgetreu-en Stammbaums des Lebens. Dieser Zweig der Wissenschaft wird nach ErnstHaeckel als \Phylogenetik" bezeichnet { die Entwicklungsgeschichte der Stam-me.
Publié le : jeudi 1 janvier 2009
Lecture(s) : 33
Tags :
Source : D-NB.INFO/999966022/34
Nombre de pages : 190
Voir plus Voir moins

A phylogenetic potpourri
Computational methods for analysing
genome-scale data
Dissertation
der Fakultat fur Informations- und Kognitionswissenschaften
der Eberhard-Karls-Universitat Tubingen
zur Erlangung des Grades eines
Doktors der Naturwissenschaften
(Dr. rer. nat.)
vorgelegt von
Dipl.-Inform. Alexander F. Auch
aus Stuttgart
Tubingen
2009Tag der mundlic hen Quali kation: 13.01.2010
Dekan: Prof. Dr. Oliver Kohlbacher
1. Berichterstatter: Prof. Dr. Daniel H. Huson
2. Berichterstatter: Dr. Alexandros Stamatakis
The Exelixis Lab
Technische Universitat Munc henErklarung
Hiermit erklare ich, da ich diese Schrift selbst andig und nur mit den ange-
gebenen Hilfsmitteln angefertigt habe und da alle Stellen, die im Wortlaut
oder dem Sinne nach anderen Werken entnommen sind, durch Angaben der
Quellen kenntlich gemacht sind. Eine detaillierte Abgrenzung meiner eige-
nen Leistungen von den Beitragen meiner Kooperationspartner und von Im-
plementierungsleistungen, die im Rahmen von mir betreuter Studien- und
Diplomarbeiten erbracht worden sind, habe ich explizit in Anhang B vorge-
nommen.
Tubingen, September 2009 Alexander AuchivZusammenfassung
Seit den Anfangen der Erforschung evolutionarer Prozesse gilt das Bestre-
ben dieser Disziplin der Rekonstruktion eines moglic hst wirklichkeitsgetreu-
en Stammbaums des Lebens. Dieser Zweig der Wissenschaft wird nach Ernst
Haeckel als \Phylogenetik" bezeichnet { die Entwicklungsgeschichte der Stam-
me. Die ersten phylogenetischen Methoden benutzten morphologische Merk-
male zur Unterscheidung von Arten, um daraus einen Stammbaum des Le-
bens zu erstellen. Allerdings ist diese Methodik nur beschrankt auf Mikro-
organismen anwendbar, da diese nur wenige gut zu unterscheidende mor-
phologische Merkmale besitzen. Erst die Entschlusselung der DNA-Struktur
durch Francis Crick und James Watson, sowie die Entwicklung der Sanger-
Sequenziertechnologie ermoglic hten es, genetische Informationen zur phylo-
genetischen Rekonstruktion heranzuziehen.
Noch unbeantwortet ist hingegen die Frage nach der tatsac hlichen Exi-
stenz eines prokaryotischen Baums des Lebens. Prokaryoten (Bakterien und
Archaea) besitzen Mechanismen fur den direkten Austausch von genetischem
Material zwischen Zellen, die zu verschiedenen Arten gehoren konnen (hori-
zontaler Gentransfer). Dies bedeutet, da ein Gen auch durch andere Wege
als die klonale Vermehrung erhalten werden kann, die eben nicht durch eine
Baumstruktur reprasen tiert werden konnen. In dieser Dissertation stellen
wir die GBDP-Methodik ("Genome BLAST distance phylogeny") vor, mit
der Phylogenien aus ganzen Genomen berechnet werden konnen. Die Er-
gebnisse der GBDP-Methodik werden mit einer Taxonomie verglichen, die
auf der Phylogenie von Einzelgenen basiert. Des weiteren untersuchen wir
den Anteil von horizontalem Gentransfer in einer Gruppe von Genen, die in
allen von uns untersuchten prokaryotischen Genomen vorkommen. Fur diese
Untersuchung benutzen wir sowohl eine aktuelle Methode, wie zwei von uns
neu vorgestellte Ansatze. Zusatzlich schlagen wir hier eine neue Methode
zur Spezies-Bestimmung bei Prokaryoten vor, die auf der GBDP-Methodik
basiert.
Im letzten Teil der Dissertation werden mehrere Software-Pakete vor-
gestellt. Zusammen mit AxPara t und AxPcoords stellt CopyCat das er-
ste Grid-fahige Software-Paket dar, das speziell im Hinblick auf gro ange-
legte kophylogenetische Analysen entwickelt wurde. Mit diesen Program-
men konnen gro e Wirts- und Parasitenphylogenien miteinander auf Uber-vi
einstimmungen hin untersucht werden. Des weiteren wird MEGAN vorge-
stellt, eine benutzerfreundliche Software-Applikation fur die Analyse von
Metagenomik-Datensatzen, sowie MetaSim, ein Simulationsprogramm fur atze, das zur Unterstutzung der Entwicklung und Ve-
ri kation von Metagenomik-Software entwickelt wurde.Abstract
Since the dawn of evolutionary biology, it was the dream of scientists to
obtain a meaningful genealogy of species, a \tree of life". The term \phylo-
genetics" was coined by Ernst Haeckel for that area of research, meaning the
history of the evolutionary relationships between species. First phylogenetic
approaches focused on morphological di erences between species. However,
the analysis of the phylogeny of microbial organisms is hindered due to the
limited number of observable morphological di erences. With the discov-
ery of the structure of DNA by Francis Crick and James Watson, and the
development of the Sanger sequencing technology, it became feasible to use
genetic information for phylogenetic inference.
Regarding the prokaryotic universe (Bacteria and Archaea), a main ques-
tion of phylogenetics is whether there exists a prokaryotic \tree of life" actu-
ally. Those organisms exhibit mechanisms for the direct exchange of genetic
material between cells that can belong to di erent species (called horizontal
gene transfer). Accordingly, genes can be derived from di erent organisms
rather than via clonal reproduction, as expressed by a phylogenetic tree.
In this thesis, we introduce the GBDP (\Genome BLAST distance phy-
logeny") framework for inferring phylogenies based on whole genomes, and
we compare the results with a current taxonomic tree based on single genes.
Furthermore, we investigate the amount of horizontal gene transfer in a
common set of prokaryotic genes by using a state-of-the-art method, as well
as two newly developed approaches. Additionally, a new method for species
delineation is proposed that is based on the GBDP method for deriving
whole genome phylogenies.
In the last part of the thesis, several software packages are presented.
CopyCat, together with AxPara t and AxPcoords, represents the rst Grid-
enabled software package that is optimized for large-scale cophylogenetic
studies. With these tools, large host and parasite phylogenies can be screened
for correlations. Furthermore, MEGAN, a user-friendly software application
for the analysis of metagenomic datasets is presented. Metagenomics is the
study of microorganismal communities by direct extraction of DNA from en-
vironmental samples. To aid the development and testing of metagenomic
software, we developed MetaSim, a tool to generate simulated
datasets.viiiAcknowledgements
I have to thank my advisor Daniel Huson for providing me the opportunity
to work in his department during my PhD. Also, I want to thank my co-
advisor Alexandros Stamatakis for his kind support and many constructive
suggestions which helped to improve my work.
Amongst others, I am deeply grateful to Markus G oker for many helpful
comments, ideas, and for sharing his profound biological knowledge with
me. Whenever I had to struggle with a scienti c problem, he took the time
to listen to me { and in most cases :-), he also had the right idea. Tremen-
dous thanks go to my cooperation partners, Stefan Henz, Janko Dietzsch,
Stephan Steigele, Guido Grimm, Matthias Schlee, Heinz Stockinger, Bar-
bara Holland, Esther Rheinbay, Jan P. Meier-Koltho , Felix Ott, Friedrich
G otz, and Tilmann Weber. It was a great pleasure and honor for me to
work with you, guys!
I also want to thank my colleagues, namely Tobias Dezulian, Christian
Rausch, Sandra Gesing, Holger Gast, Julia Trie inger, Marine Gaudefroy-
Bergmann, Jan Schulze, Kay Nieselt, Suparna Mitra, and Regula Rupp.
Special thanks goes to Daniel Richter, who had to endure me as o ce
roommate, and during many semesters where we jointly organized teaching
courses. It always was a pleasure to work with you! Moreover, I remember
many funny conversations I had with Daniel Richter during my PhD. It was
a great time!
Last but not least, I want to express my gratitude towards Sabine Auch,
Manfred Gerblinger, and Jochen Schumacher. They always listened to me
when I stroke a bad patch, and their optimism helped me a lot. In this
context, I want to dedicate my work to Epicurus, who showed me what
(and who!) is really important in life.x
In accordance with the standard scienti c protocol, I will use the personal
pronoun \we" to indicate the reader and the writer or (as explained in
Appendix B) my scienti c collaborators and myself.

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.