A computational strategy for the prediction of functional interaction motifs [Elektronische Ressource] / vorgelegt von Holger Dinkel

De
holger dinkelA C O M P U T A T I O N A L S T R A T E G Y F O R T H E P R E D I C T I O N O FF U N C T I O N A L I N T E R A C T I O N M O T I F SA C O M P U T A T I O N A L S T R A T E G Y F O R T H E P R E D I C T I O N O FF U N C T I O N A L I N T E R A C T I O N M O T I F SDer Naturwissenschaftlichen Fakultätder Friedrich-Alexander-Universität Erlangen-NürnbergzurErlangung des Doktorgradesvorgelegt vonholger dinkelaus ScheßlitzAls Dissertation genehmigtvon der Naturwissenschaftlichen Fakultätder Universität Erlangen-NürnbergTag der mündlichen Prüfung: 22. Dez. 2008Vorsitzender der Promotionskommission: Prof. Dr. E. BänschErstberichterstatter: Prof. Dr. H. StichtZweitberichterstatter: Prof. Dr. T. WinklerTomy dearest motif:A-L-E-xA C K N O W L E D G M E N T Sprof. heinrich sticht, meinem Betreuer, Leiter und Mentor. Er hat mir nicht nur dieGelegenheit gegeben, diese Doktorarbeit anzufertigen, sondern auch für die finanzielleUnterstützung gesorgt. Außerdem hatte er stets ein offenes Ohr / eine offene Tür. SeineKritik war immer nur positiv und seine Einschätzung stets optimistisch. Ohne seinewertvollen Tips wäre das Projekt wohl anders verlaufen. Ich habe nie verstanden, wieer es schafft, trotz großer Diversität der verschiedenen Projekte in der Arbeitsgruppedennoch derart in der Materie zu stehen und genau die richtigen Punkte zu treffen.ag bioinformatik, für die schöne Zeit in der Gruppe.
Publié le : jeudi 1 janvier 2009
Lecture(s) : 16
Tags :
Source : WWW.OPUS.UB.UNI-ERLANGEN.DE/OPUS/VOLLTEXTE/2009/1223/PDF/DINKELHOLGER.PDF
Nombre de pages : 200
Voir plus Voir moins

holger dinkel
A C O M P U T A T I O N A L S T R A T E G Y F O R T H E P R E D I C T I O N O F
F U N C T I O N A L I N T E R A C T I O N M O T I F SA C O M P U T A T I O N A L S T R A T E G Y F O R T H E P R E D I C T I O N O F
F U N C T I O N A L I N T E R A C T I O N M O T I F S
Der Naturwissenschaftlichen Fakultät
der Friedrich-Alexander-Universität Erlangen-Nürnberg
zur
Erlangung des Doktorgrades
vorgelegt von
holger dinkel
aus ScheßlitzAls Dissertation genehmigt
von der Naturwissenschaftlichen Fakultät
der Universität Erlangen-Nürnberg
Tag der mündlichen Prüfung: 22. Dez. 2008
Vorsitzender der Promotionskommission: Prof. Dr. E. Bänsch
Erstberichterstatter: Prof. Dr. H. Sticht
Zweitberichterstatter: Prof. Dr. T. WinklerTo
my dearest motif:
A-L-E-xA C K N O W L E D G M E N T S
prof. heinrich sticht, meinem Betreuer, Leiter und Mentor. Er hat mir nicht nur die
Gelegenheit gegeben, diese Doktorarbeit anzufertigen, sondern auch für die finanzielle
Unterstützung gesorgt. Außerdem hatte er stets ein offenes Ohr / eine offene Tür. Seine
Kritik war immer nur positiv und seine Einschätzung stets optimistisch. Ohne seine
wertvollen Tips wäre das Projekt wohl anders verlaufen. Ich habe nie verstanden, wie
er es schafft, trotz großer Diversität der verschiedenen Projekte in der Arbeitsgruppe
dennoch derart in der Materie zu stehen und genau die richtigen Punkte zu treffen.
ag bioinformatik, für die schöne Zeit in der Gruppe. Ich finde es wichtig und
erstrebenswert, dass in dieser AG auch über Dinge geredet und diskutiert werden
kann, die über das eigene unmittelbare Projekt hinausgehen. Heike Meiselbach möchte
ich insbesondere für Ihre Hilfe bei Abbildungen sowie dem Korrekturlesen der Arbeit
danken. Anselm Horn danke ich für viele Denkanstöße und viele Kekse. . .
brigitte biesinger, der Mutter, großen Schwester und guten Seele des Graduiertenkollegs
gebührt besonderer Dank: Sie hat nicht nur zahllose Stunden damit verbracht, für uns
Stipendiaten Kurse, Reisen etc. zu organisieren, sondern hatte auch stets ein offenes
Ohr für Probleme.
alex kabisch, für ihre unendliche Geduld mit mir. Ohne sie hätte ich wohl nicht das
Durchhaltevermögen aufgebracht, diese Zeit durchzustehen.
meinen eltern, die nie aufgehört haben, an mich zu glauben und mich stets in jeder
erdenklichen Art und Weise unterstützt haben.
klemens pichler, für all die vielen Stunden an Diskussionen um Typographie, »Hacken«,
»T Xen«, Programmieren und den Sinn des Lebens. Auch wenn sich unsere WegeE
trennen, so weiß ich doch, daß wir diese aufregenden Zeiten nie vergessen werden. . .
manuel dehner und volker runkel danke ich für viele wissenschaftliche Diskussionen,
kritisches Korrekturlesen und wertvolle Anmerkungen ebenso wie für die richtige
Portion Ablenkung wann immer diese nötig war.
vii
ofhaveandelyp.computerpthatandseenrequecauseeautbducesrt,ecauseaecialanyisresrogramming(Donaldecauseybbrld,objectsorowitthebtoitwledgeespkno,accumulatedingenuitesskillppliiaitKnuth)WC O N T E N T S
Summary xii
i introduction 1
1 proteins are the key players of the cell 3
1.1 Modular structure of proteins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Interaction Domains . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Structural principles of domain-motif interactions . . . . . . . . . . . . . . . . . 5
1.4 Interaction Motifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Regulatory properties of linear motifs and their interactions . . . . . . . . . . . 9
1.6 Signalling Adaptors: proteins assembled from interaction domains . . . . . . . 12
2 the role of motifs in diseases 13
2.1 Diseases caused by mutated motifs . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Viruses abusing the cellular machinery . . . . . . . . . . . . . . . . . . . . . . . 13
3 Motif-Detection 17
3.1 Discovery of novel motifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.2 Identification of functional motif instances . . . . . . . . . . . . . . . . . . . . . 17
4 aim of this work 19
ii background 21
5 general algorithms 23
5.1 Regular Expressions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.2 Position-Specific Scoring Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.3 Artificial Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.4 Hidden Markov Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
6 sequence databases 27
6.1 Non-redundant sequence databases . . . . . . . . . . . . . . . . . . . . . . . . . 29
7 sequence alignment tools 31
7.1 Clustal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
7.2 T-Coffee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
7.3 Lalign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
8 tools for database searches 35
viiiHolger Dinkel contents
8.1 Scoring matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
8.2 Basic Local Alignment Search Tool . . . . . . . . . . . . . . . . . . . . . . . . . . 36
9 tools and databases for motif searches 37
9.1 Databases of interaction motifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
9.1.1 Prosite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
9.1.2 MiniMotifMiner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
9.1.3 Eukaryotic Linear Motif Database . . . . . . . . . . . . . . . . . . . . . . . . . 38
10 algorithms to predict structural properties 41
10.1 Globularity / Disorder prediction . . . . . . . . . . . . . . . . . . . . . . . . . . 41
10.1.1 DisPro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
10.1.2 GlobPlot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
10.2 Transmembrane topology prediction . . . . . . . . . . . . . . . . . . . . . . . . . 45
10.2.1 Phobius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
10.2.2 TmHmm2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
10.3 Globular domain detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
10.3.1 Pfam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
10.4 Phosphorylation prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
10.4.1 NetPhos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
iii methods 53
11 general algorithms 55
12 sequence databases 57
12.1 Non-redundant sequence databases . . . . . . . . . . . . . . . . . . . . . . . . . 57
13 dataset used 59
13.1 Representative set of interaction motifs . . . . . . . . . . . . . . . . . . . . . . . 59
14 sequence alignment tools 61
14.1 Clustal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
14.2 T-Coffee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
14.3 Lalign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
15 tools for database searches 63
15.1 Basic Local Alignment Search Tool . . . . . . . . . . . . . . . . . . . . . . . . . . 63
15.1.1 Creating custom BLAST databases from a set of sequences . . . . . . . . . . 64
16 tools and databases for motif searches 65
16.1 Databases of interaction motifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
16.1.1 Prosite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
ixcontents Holger Dinkel
16.1.2 MiniMotifMiner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
16.1.3 Eukaryotic Linear Motif Database . . . . . . . . . . . . . . . . . . . . . . . . . 65
16.2 Search for interaction motifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
17 algorithms to predict structural properties 67
17.1 Globularity / Disorder prediction . . . . . . . . . . . . . . . . . . . . . . . . . . 67
17.1.1 DisPro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
17.1.2 GlobPlot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
17.2 Transmembrane topology prediction . . . . . . . . . . . . . . . . . . . . . . . . . 68
17.2.1 Phobius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
17.2.2 TmHmm2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
17.3 Globular domain detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
17.3.1 Pfam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
17.4 Phosphorylation prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
17.4.1 NetPhos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
18 interaction motifs in viral proteins 75
18.1 Analysis of the Epstein-Barr virus proteome . . . . . . . . . . . . . . . . . . . . . 75
18.1.1 Obtaining protein sequences . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
18.1.2 BLAST-search for homologous sequences . . . . . . . . . . . . . . . . . . . . . 76
18.2 Interaction motifs in the human immunodeficiency virus p6 protein . . . . . . . . 76
iv results 77
19 motif filtering 79
19.1 Globularity / Disorder prediction . . . . . . . . . . . . . . . . . . . . . . . . . . 79
19.1.1 DisPro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
19.1.2 GlobPlot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
19.2 Globular domain detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
19.2.1 Pfam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
19.3 Transmembrane topology prediction . . . . . . . . . . . . . . . . . . . . . . . . . 83
19.4 Phosphorylation prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
19.5 Using filter combinations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
19.5.1 Combining DisPro & GlobPlot . . . . . . . . . . . . . . . . . . . . . . . . . . 88
19.5.2 Pfam-d & DisPro . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
19.5.3 Combining Pfam-d & GlobPlot . . . . . . . . . . . . . . . . . . . . . . . . . . 90
19.5.4 TmHmm2 & Phobius . . . . . . . . . . . . . . . . . . . . . . . . . 90
19.5.5 Combining Pfam-d & the Topology filter . . . . . . . . . . . . . . . . . . . . 92
20 motif scoring 95
20.1 Estimation of motif occurrences . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
x

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.