La lecture à portée de main
Découvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDécouvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDescription
Sujets
Informations
Publié par | technischen_universitat_darmstadt |
Publié le | 01 janvier 2010 |
Nombre de lectures | 13 |
Langue | English |
Poids de l'ouvrage | 14 Mo |
Extrait
andProteinfoldingstructuredynamicsprediction
FaltungsdynamikundProteinstrukturvorhersageZurErlangungdesGradeseinesDoktorsderNaturwissenschaften(Dr.rer.nat.)
genehmigteDissertationvonDipl.-Phys.KatrinWolausOenbach
Februar2010—Darmstadt—D17
FInsactituhbetrefürichFePhstkysikörperphysik
PrProotteeininsstrutrukturcturveorprheedirscagtioenunanddFfolaltundinggsddynynamiamikcs
GenehmigteDissertationvonDipl.-Phys.
1.Gutachten:Prof.Dr.MarkusPorto
2.Gutachten:Prof.Dr.BarbaraDrossel
TTaaggddeerrEinrPrüfuneicg:hun1g:5.02.2005.0110.2010
Darmstadt—D17
Kintra
olW
sua
Oenbach
DissertationzurErklärung
HiermitversichereichdievorliegendeDissertationohneHilfeDritternurmitden
angegebenenQuellenundHilfsmittelnangefertigtzuhaben.AlleStellen,dieaus
Quellenentnommenwurden,sindalssolchekenntlichgemacht.Eswurdenochkein
Promotionsversuchunternommen.
Darmstadt,den26.Februar2010
l)oW.(K
Abstract
Thewiththetopicofquestionproteinofhowfoldingthecanbebiologicallystudiedrelevantfromtwothree-dimensionaldifferentpointsofstructureview.canTheberstisdeterminedconcernedfrom
agivenaminoacidsequence.Thisisofgreatpracticalinterestasexperimentaldeterminationofprotein
structureisdifcultandcostly,whereassequencingisrelativelysimpleandcheap.Thesecondquestionis
isthatofassumed.theAsphysicalproteinprocessofmisfoldingfoldingisthewherecauseoftenofseveralknowledgeofdiseases,thethisisbiologicallyofactivebio-medical(native)importancestructureas
well.ThisthesisMoreover,coversitisalsotheseoftwofundamentalaspectsofinterestproteinasafolding.mesoscopicTothissystemendso-calleddisplayingstructuralcooperativeproleseffects.are
deneddiction.Onwhichthemayotheractashandalinktheybetweencontainproteinstructuresequenceinformationandinastructurecompressedfortheformtaskofwhich,structureaswillpre-be
shown,alsoencodesthefoldingprocess.
Adetailedseverestructurebottleneckindescriptionproteinandthestructurerenementpredictionofisstructurethetransitioncandidatesfromthataarecoarse-grainedalreadyclosetoatomorethe
oftargetpromisingstructure.Ascandidates.renementThisisisverywherestructuralcomputation-intensiveprolesitpredictedisadvisablefromtosequenceconcentrateprovetoonbeaselectionadvanta-
ifgeous.theTheirstructuresetusefulnessisofinonlylteringismoderateatleastqualityonparortoiftheestablishedcriterionismethodsespeciallyandtheystrictareonclearlywhatissuperiortobe
structure.goodaconsideredAnimportantquestionregardingthefoldingprocessisinhowfarthestructureofthenativestate
quence.dictatestheOneclassfoldingofsuchpathway,thusnative-centricallowingmodelstoareabstractso-calledfromGthe¯o-modelschemicalwhichdetailsofadditionallytheaminorelyacidonthese-
stateprincipleattractofeachminimumother.Infrustration,contrast,themeaningmodelthatonlypresentedthosehere,aminowhichacidsisthatbasedareoninstructuralcontactintheproles,nativeal-
lowsthreenon-nativewell-studiedinteractions.exampleproteinsApplyingshowsadaptedthatsamplingexperimentalschemesresultstoandbothbehaviournative-centricobservedmodelsinanddetailedto
all-atomsimulationscanbebetterexplainedintheprole-basedmodelthanintheG¯o-model.Inpartic-
ular,theprole-basedmodelshowsacooperativefoldingtransitionandexistenceofsecondarystructure
infoldingtheunfoldedbehaviour,state.theThus,prole-basedwhileasimplemodel,modelwhichisbasedonnative-centricpairwiseaswell,contactscancannotreproduceadequatelyfundamentaldescribe
observations.experimental
Zusammenfassung
DerThemenkomplexderProteinfaltungkannauszweiverschiedenenBlickwinkelnbetrachtetwerden.
ZumeinenstelltsichdieFrage,wiebeigegebenerAminosäuresequenzdiefürdiebiologischeFunktion
maßgeblichedreidimensionaleStrukturbestimmtwerdenkann.DiesistvonenormempraktischenInter-
esse,dadieexperimentelleStrukturaufklärungvonProteinenzeitaufwändigundteuerist,währenddie
Sequenzierungvergleichsweiseeinfachundgünstigmöglichist.DerzweiteAspektistderphysikalische
Vgesetzt.organgderAuchFdiesaltung.istvonHierbeiwirddiebiologisch-medizinischernative,biologischBedeutung,aktivedadieStrukturFvielfachalschfaltungalsvonbekanntProteinenvoraus-zu
SystemverschiedenenmitkooperativenKrankheitenEffektenführenauchkann.vonDarüberfundamentalemhinausistderInteresse.Faltungsvorgangalsmesoskopisches
DievorliegendeDoktorarbeitbeleuchtetdiesebeidenFragestellungenderProteinfaltung.ZuBeginn
werdensogenannteStrukturproledeniert,dieeinerseitsalsBindegliedzwischenSequenzundStruk-
turinderStrukturvorhersagefungierenkönnen,undandererseitsStrukturinformationund,wiegezeigt
wird,FaltungsinformationinkomprimierterFormenthalten.
EinschreibungEngpassundindiederweitereStrukturvorhersageOptimierungvonistderStrukturen,ÜbergangderenvongenerellegrobkörnigerFaltungzubereitsdetaillierterderZielstrukturStrukturbe-
entspricht.DadieserSchrittsehrvielRechenleistunginAnspruchnimmt,empehltessich,eineVor-
auswahlderStrukturkandidatenzutreffen.AndieserStellekommenvorhergesagteStrukturprolezum
Tragen,die,wieindieserArbeitgezeigtwird,mitherkömmlichenAuswahlmethodenmindestensgleich-
wertigundunterbestimmtenBedingungensogardeutlichüberlegensind.Diesistinsbesonderedannder
Fall,wenndieUrsprungsmengederStrukturkandidatenvonnurmäßigerQualitätistodereinbesonders
striktesKriteriumandieQualitätderausgewähltenStrukturenangelegtwird.
EinewichtigeFragezumFaltungsprozessist,inwieferndiegefalteteStrukturdenFaltungswegvor-
gibtunddahervonchemischenDetailsderAminosäuresequenzabstrahiertwerdenkann.Einesolche
nativ-zentrierteModellklassesindsogenannteG¯o-Modelle,diezusätzlichaufdemPrinzipderminima-
lenFrustrationberuhenundnursolcheKontaktezwischenAminosäurenanziehendgestalten,dieauch
indernativenStrukturbestehen.ImGegensatzdazukönnenindemhiervorgestelltenModell,wel-
chesaufStrukturprolenberuht,auchnicht-nativeWechselwirkungenauftreten.Anhandangepasster
Sampling-MethodenwirddannfürdreigutuntersuchteBeispielproteinegezeigt,dassdasFaltungsver-
haltenprolbasierterModellebessermitexperimentellbeobachtetemVerhaltenunddematomaraufge-
lösterSimulationenübereinstimmtalsdiesfürdasG¯o-ModellderFallist.Diesbeziehtsichinsbesondere
aufdieKooperativitätdesFaltungsübergangsunddasVorhandenseinvonSekundärstrukturimungefalte-
tenZustand.WährendeineinfachesaufpaarweisenKontaktenbasierendesModelldasFaltungsverhalten
alsonichtadäquatbeschreibenkann,istesdennochmöglichmitnativ-zentriertenModellen,wiedem
prolbasiertenModell,grundlegendeBeobachtungenzureproduzieren.
Contents
1Introduction11.1Motivation.................................................1
1.2ProteinStructure.............................................2
1.3ContactMapsandStructuralProles.................................5
11PredictionStructureProtein22.1Motivation.................................................11
2.2StructureSelection............................................12
2.2.1BenchmarkStructures......................................13
2.2.2PredictionofStructuralProles................................15
2.2.3DistributionofRosettaCandidateStructures........................16
2.2.4FilteringofRosettaCandidates................................18
2.2.5FilteringofCASP8Models...................................25
2.3Discussion..................................................26
29DynamicsFoldingProtein33.1Motivation.................................................29
3.2TheProteinModel............................................30
3.3ProteinStructureReconstruction....................................36
3.4FoldingSimulationsandFreeEnergyLandscapes..........................38
3.4.1FoldingSimulations,TimeSeriesandDistributionsofObservables..........39
3.4.2ConstrainedSampling......................................42
3.4.3Metadynamics..........................................44
3.4.4ConstrainedSamplingandMetadynamicsCombined...................47
3.4.5ExampleProteinsandComparisonofModels.......................49
3.4.6ContactMapsasMicrostates..................................60
3.4.7HeatCapacitiesandFoldingTransitions...........................61
3.5Discussion..................................................64
andConclusion4Outlook
ARMSDandTM-ScoreDistributionofCandidateStructures
67
69
i
ii
FiguresofList
1.1Aminoacidsandpeptidebond.....................................3
1.2Proteinsequenceandproteinstructure................................5
1.3Coarse-grainedproteinstructure....................................6
1.4Contactmapandstructureproles..................................6
2.1ArticialNeuralNetwork(ANN)topredictstructuralprolefromsequence.........15
2.2DistributionofRMSDand1TM-scoreforproteins1pv0and1ubq..............17
2.3CorrelationoftheRosettascoreandtheEC-scoreforexactproleandpredictedprole,
toRMSDforproteins1ubqand1shg.................................19
2.4RMSDand1TM-scoredistributionoflteredstructuresforproteins1c9oAand1ubq..20
2.5RMSDdistributionoflteredandclusteredstructuresforproteins1c9oAand1btb.....21
2.6Numberofgoodstructuresindependanceofnumberofselectedstructuresforproteins
1c9oAand1ubq..............................................23
2.7DistributionoflteredstructuresforinterpolatedECsforproteins1gb1and1c9oA....23
2.8RelativefrequenciesofgoodstructuresfortheCASP8set.....................26
3.1Tubemodel.................................................30
3.2MovesetofMonteCarlosimulation..................................31
3.3Restricteds