New statistical methods of genome-scale data analysis in life science [Elektronische Ressource] : applications to enterobacterial diagnostics, meta-analysis of Arabidopsis thaliana gene expression and functional sequence annotation  = Neue statistische Methoden für genomweite Datenanalysen in den Biowissenschaften / submitted by Torben Friedrich
193 pages
English

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

New statistical methods of genome-scale data analysis in life science [Elektronische Ressource] : applications to enterobacterial diagnostics, meta-analysis of Arabidopsis thaliana gene expression and functional sequence annotation = Neue statistische Methoden für genomweite Datenanalysen in den Biowissenschaften / submitted by Torben Friedrich

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
193 pages
English
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

New statistical Methods of Genome-Scale Data Analysis in Life Science -Applications to enterobacterial Diagnostics, Meta-Analysis ofArabidopsisthalianaGene Expression and functional Sequence AnnotationNeue statistische Methoden für genomweite Datenanalysen in den Biowissenschaften -Anwendungen in der Enterobakteriendiagnostik, Meta-Analyse vonArabidopsisthaliana Genexpression und funktionsbezogenen SequenzenannotationDoctoral thesis for a degree at the Graduate School of Life Sciences, Julius-Maximilians-UniversitätWürzburg, Section Infection and Immunity, ZINF/IMIBsubmitted byTorben FriedrichfromBuchholz in der NordheideWürzburg 2009Submitted on: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Office stampMembers of the Promotionskomitee:Chairperson: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prof. Dr. Manfred GesslerPrimary Supervisor: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prof. Dr. Drs. h. c. Jörg HackerSupervisor (Second): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prof. Dr. Thomas DandekarSupervisor (Third):. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Prof. Dr. Sven RahmannSupervisor (Fourth): . . . . . . . . . . . . . .

Sujets

Informations

Publié par
Publié le 01 janvier 2009
Nombre de lectures 7
Langue English
Poids de l'ouvrage 8 Mo

Extrait

New statistical Methods of Genome-Scale Data Analysis in Life Science -
Applications to enterobacterial Diagnostics, Meta-Analysis ofArabidopsisthaliana
Gene Expression and functional Sequence Annotation
Neue statistische Methoden für genomweite Datenanalysen in den Biowissenschaften -
Anwendungen in der Enterobakteriendiagnostik, Meta-Analyse vonArabidopsis
thaliana Genexpression und funktionsbezogenen Sequenzenannotation
Doctoral thesis for a degree at the Graduate School of Life Sciences, Julius-Maximilians-Universität
Würzburg, Section Infection and Immunity, ZINF/IMIB
submitted by
Torben Friedrich
from
Buchholz in der Nordheide
Würzburg 2009Submitted on: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Office stamp
Members of the Promotionskomitee:
Chairperson: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prof. Dr. Manfred Gessler
Primary Supervisor: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prof. Dr. Drs. h. c. Jörg Hacker
Supervisor (Second): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prof. Dr. Thomas Dandekar
Supervisor (Third):. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Prof. Dr. Sven Rahmann
Supervisor (Fourth): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . PD Dr. Ulrich Dobrindt
Date of Public Defence: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Date of receipt of Certificates:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Danksagung
Ganz besonders möchte ich Tobias Müller und Ulrich Dobrindt für eine exzellente Betreuung, vie-
le hilfreiche Diskussionen und gute Ideen sowie Ratschläge danken. Mein Dank gilt auch meinem
Promotionskomitee. Thomas Dandekar hat nicht nur mit wertvollen Diskussionen zu allen Teilbe-
reichen der Arbeit, sondern auch mit der Bereitstellung eines hervorragenden Arbeitsumfeldes sehr
unterstützt. Jörg Hacker hat den Prozess der Doktorarbeit beratend begleitet und wertvolle Ideen ein-
fließen lassen. Durch die vielen bestehenden Kontakte war eine ideale Ausgangsbasis bezüglich der
Datenbeschaffung gegeben. Sven Rahmann danke ich für die Kooperation bei der Entwicklung des
diagnostischen Microarrays und als Mitglied des Promotionskomitees. Er hat mit vielen Anregungen
und seiner Erfahrung in den Bereichen Microarray-Design und -Auswertung zu dem Projekt beige-
tragen.
Finanzielle Unterstützung für die Arbeit kam von dem Forschungsverbund FORINGEN (TP-A1)
der Bayerischen Forschungsstiftung. Für die Möglichkeit, die Testhybridisierungen bei der Scieni-
on AG durchführen zu können, gilt mein besonderer Dank den dortigen direkten Ansprechpartnern
Wilfried Weigel und Sabine Fischer. Für die Erlaubnis zur Verwendung der unveröffentlichten Ge-
nomsequenzen von S. bongori 12419 und E. coli O42 gilt mein Dank Julian Parkhill vom Sanger
Institut, Cambridge, U.K. .
Danken möchte ich auch allen Kollegen in der Bioinformatik und Infektionsbiologie, mit denen ich
im Laufe der Doktorarbeit zusammengearbeitet habe. Sie haben wesentlich zu einem produktiven und
kurzweiligen Arbeitsumfeld beigetragen, das in beiden Instituten gegeben war. Barbara und Markus
möchte ich für das Korrekturlesen der Arbeit danken. Außerdem gilt mein Dank Julia Engelmann,
Daniela Beißer, Juilee Thakar, Christian Koetschan, Philipp Seibel für eine tolle gemeinsame Zeit im
Raum 117.
Aber vor allem möchte ich meinen Eltern danken, die mir mit ihrer uneingeschränkten Unterstüt-
zung das Studium und damit diese Doktorarbeit überhaupt erst möglich gemacht. Lydia und Peter
danke ich für die Möglichkeit, ihr ‘Freiluftbüro’ nutzen zu dürfen und für ihre Unterstützung in allen
Belangen. Barbara hat die Doktorandenzeit mit der richtigen Mischung aus Ablenkung, Führsorge
und Geduld unvergesslich werden lassen.
4Zusammenfassung
Die aktuellen Fortschritte und Entwicklungen in der Molekularbiologie stellen eine Fülle neuer, bisher
kaum analysierter Daten bereit. Dieser Fundus umfasst unter Anderem biologische Daten zu geno-
mischer DNA, zu Proteinsequenzen, zu dreidimensionalen Proteinstrukturen sowie zu Genexpressi-
onsprofilen. In der vorliegenden Arbeit werden diese Informationen genutzt, um neue Methoden der
Charakterisierung und Klassifizierung von Organismen bzw. Organismengruppen zu entwickeln und
einen automatisierten Informationsgewinn sowie eine Informationsübertragung zu ermöglichen.
Die ersten beiden vorgestellten Ansätze (Kapitel 4 und 5) konzentrieren sich auf die medizinisch
und wissenschaftlich bedeutsame Gruppe der Enterobakterien. Deren Bedeutung für Medizin und
Mikrobiologie geht auf ihre Funktion als kommensale Bewohner des Darmtraktes, ihre Nutzung als
leicht kultivierbare Modellorganismen und auf die vielseitigen Infektionsmechanismen zurück. Ob-
wohl bereits viele Studien über einzelne Pathogruppen mit klinisch unterscheidbaren Symptomen
existieren, sind die genotypischen Faktoren, die für diese Unterschiedlichkeit verantwortlich zeich-
nen, teilweise noch nicht bekannt. Der in Kapitel 4 beschriebene umfassende Genomvergleich wurde
anhand einer Vielzahl von Enterobakterien durchgeführt, die nahezu die gesamte Bandbreite klinisch
relevanter Diversität darstellen. Dieser Genomvergleich bildet die Basis für eine Charakterisierung
des enterobakteriellen Genpools, für eine Rekonstruktion evolutionärer Prozesse und Einflüsse und
für eine umfassende Untersuchung spezifischer Proteinfamilien in enterobakteriellen Untergruppen.
Die in diesem Kontext vorher noch nicht angewandte Korrespondenzanalyse liefert qualitative Aus-
sagen zu bakteriellen Untergruppen und den ausschließlich in ihnen vorkommenden Proteinfamilien.
In drei Hauptuntergruppen der Enterobakterien, die den Gattungen Yersinia und Salmonella sowie
der Gruppe aus Shigella und E. coli entsprechen, wurden die jeweils spezifischen Proteinfamilien mit
Hilfe statistischer Tests identifiziert. Zusammenfassend bilden die auf Genomvergleichen aufbauen-
den Methoden neue Ansatzpunkte, um aus der Übertragung der bekannten Funktionalität einzelner
Proteine auf spezifische, genotypische Besonderheiten bakterieller Gruppen zu schließen.
Aufgrund ihrer hohen medizinischen Relevanz war die Typisierung enterobakterieller Isolate ent-
sprechend ihrer Pathogenität Ziel zahlreicher Studien. Die Microarray-Technologie bietet ein schnel-
les, reproduzierbares und standardisierbares Hilfsmittel für bakterielle Typisierung und hat sich in
der Bakteriendiagnostik, Risikobewertung und Überwachung bewährt. Das in Kapitel 5 beschriebene
Design eines diagnostischen Microarray beruht auf einer großen Anzahl verfügbarer Genomsequen-
zen von Enterobakterien. Ein hocheffizienter String-Matching-Algorithmus ist die Grundlage einer
neuartigen Strategie der Sondenauswahl, die sowohl kodierende als auch nicht-kodierende Berei-
5che genomischer DNA berücksichtigt. Im Vergleich zu Diagnostika, die ausschließlich auf Virulenz-
assoziierten Sonden beruhen, verringert dieses Prinzip das Risiko einer inkorrekten Typisierung. Zu-
sätzliche Sonden erweitern das Anwendungsspektrum auf eine simultane Diagnostik der Antibiotika-
resistenz bzw. eine Überwachung der Resistenzausbreitung.
Umfangreiche Testhybridisierungen belegen eine überwiegende Zuverlässigkeit der Sonden und
vor allem eine robuste Klassifizierung enterobakterieller Stämme entsprechend der Pathogruppen.
Die Tests bilden zudem die Grundlage für das Training eines Regressionsmodells zur Klassifizierung
der Pathogruppe und zur Vorhersage der Menge hybridisierter DNA. Das Regressionsmodell zeichnet
sich durch kontinuierliche Lernfähigkeit und damit durch eine Verbesserung der Vorhersagequalität
im Prozess der Anwendung aus. Ein Teil der Sonden repräsentiert intergenische DNA und bestätigt
infolgedessen die Relevanz der zugrunde liegenden Strategie. Die Tatsache, dass ein großer Teil der
von den Sonden repräsentierten Gene noch nicht annotiert ist, legt die Existenz bisher unentdeckter
Faktoren mit Bedeutung für die Ausbildung entsprechender Virulenz-Phänotypen nahe.
Ein weiteres Haupteinsatzgebiet von Microarrays ist die Genexpressionsanalyse. Die Größe von
Genexpressionsdatenbanken ist in den vergangenen Jahren stark gewachsen. Obwohl sie eine Fül-
le von Expressionsdaten bieten, sind Ergebnisse aus unterschiedlichen Studien weiterhin schwer in
einen übergreifenden Zusammenhang zu bringen. In Kapitel 6 wird die Methodik einer ausschließ-
lich datenbasierten Meta-Analyse für genomweite A. thaliana Genexpressionsdatensätze dargestellt,
die neue Erkenntnisse über Funktion und Regulation von Genen verspricht. Die Anwendung von
Kernel-basierter Hauptkomponentenanalyse in Kom

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents