cours-evolstruct
27 pages
Français

cours-evolstruct

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
27 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Evolutiondesstructures12novembre20092Tabledesmatières1 Introduction 51.1 BanquesetClassifications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.1.1 Banquesdestructures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.1.2 Classificationdesstructures . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2 Classificationshiérarchiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2.1 SCOP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2.2 CATH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.2.3 FSSP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.3 Classificationsnonhiérarchiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.3.1 DALIDomainDictionnary . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.3.2 CEdatabase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.4 Alignementsmultiplesdefamillesdestructures . . . . . . . . . . . . . . . . . . . . 131.4.1 3D PSSM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.4.2 HOMSTRAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.4.3 PALI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.4.4 LPFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.5 Banquesd’alignementsstructuraux . . . . . . . . . . . . . . . . . . . . . . ...

Informations

Publié par
Nombre de lectures 67
Langue Français

Extrait

Evolution21dsestructuresnovembre9002
2
12TabledesmatièresIntroduction1.1BanquesetClassications...............................1.1.1Banquesdestructures.............................1.1.2Classicationdesstructures..........................1.2Classicationshiérarchiques..............................1.2.1SCOP......................................1.2.2CATH......................................1.2.3FSSP......................................1.3Classicationsnonhiérarchiques............................1.3.1DALIDomainDictionnary...........................1.3.2CEdatabase...................................1.4Alignementsmultiplesdefamillesdestructures....................1.4.13D-PSSM....................................1.4.2HOMSTRAD..................................1.4.3PALI......................................1.4.4LPFC......................................1.5Banquesdalignementsstructuraux...........................1.5.1HOMALDB..................................1.5.2MMDB.....................................Analysedesstructures2.1Méthodesdanalysedesstructures...........................2.1.1Modesnormaux................................Modesnormauxetmouvements........................Modesnormauxetévolution..........................2.2Analysedesdomaines..................................2.2.1Premièresétapesdelévolutionprotéique...................théoriedesboucles(Trifonovetcoll.).....................3599999011121122131314141414141517171717181818191
42.2.2Corrélationaveclesintrons-Théorieexoniquedesgènes2.3Analysedesrepliements............1.3.2BibliographieUsagedesrepliementssurlesgénomes..............................Tabledesmatières.....................91020232
Chapitre1IntroductionOnconsidèrequelastructured’uneprotéineseconservebienpluslongtempsquesaséquence(ChothiaetLesk,1986).Note:lesinsertionsetdélétions("indels")ainsiquelessubstitutionsd’acidesaminéssontlesévenementslespluscommunsdansl’évolutiondesprotéines.Lesindelssontunordredegrandeurmoinsfréquentsquelessubstitutions.Eneffet,onadenombreuxexemplesdeprotéinesayantdesrepliementssimilairesetneprésentantquepeuderessemblanceauniveaudeleursséquences.Yat-ildescontre-exemples,c’estàdiredescasoùdesprotéinessonthomologues(ellesontunancêtrecommun)maispossèdentdesdifférencesstructuralesnotables?Enfait,onclasselesprotéinesparrepliements("fold").Onconsidèreque2protéinesontlemêmerepliementsiellespartagentlesmêmesélémentsdestructuresecondairedanslamêmeorientationetaveclamêmetopologie.Lasubjectivitérègnelorsqu’onappliquecettedéfinitionauxvraiesprotéines.Néanmoins,onpeutconstaterdesmotifsstructurauxquisontrécurrentsdanslesstructuresdepro-téines.Parexemple,onpeutciterlestonneaux(β,α)8,lesrepliementsimmunoglobulines(protéinestoutβ,sandwichà2couchesde7brinsβanti-parallèlesarrangésen2feuilletsβ)oulesfeuilletsRossmann(3ouplusfeuilletsβparallèlesliéspar2hélicesαdansl’ordreβαβαβ).Lesprotéinesquiontlemêmerepliementn’ontdoncpasnécessairementunancêtrecommun,lasimilaritéstructuralepouvantinterveniràcausedunombrelimitéd’arrangementsspatiauxpourlesmêmesstructuressecondaires.Maisilexisteaussidesprotéineshomologuesquiontdesdifférencesstructuralesmajeures(Grishin,2001).Voirlesfigures1.1,1.2.Ilexisteaussidespermutationscirculaires(lafindevientledébut).SilapartieN-terminaleestplacéedanslarégiondelapartieC-terminale,ilneserapastropdramatiqued’opérerunetellepermu-tation.LepremierexempledecelaaétéleclivageetlaligationdesdeuxfragmentsdeconcanavalineA:ils’agitd’unemodificationpost-traductionnelle.Cetransfertpeutaussiarriverauniveaudugène,etungrandnombred’exemplesontétérapportés(Goldenberg,1989;LindqvistandSchneider,1997;PanandUhlenbeck,1993;RussellandPonting,1998).VoirlapermutationdesprotéinesC2figure.3.1L’existencedecessingularités(pasforcémentrares)introduitdesdifficultéssérieusespourlesméthodesdeclassificationsstructurales.C’estàdirequ’uneclassificationstructuralenepeutpasfa-cilementêtrephylogénétique,saufàintroduirelaphylogénieetàsebasersurellepourfonderlaclassification,quidevradonc"oublier"lesdifférencesstructurales.5
6Chapitre1.IntroductionFIG.1.1–ChangementdrastiquedelaLuciferasebactérienneàlaflavoprotéinenonfluorescente(NFP)codéeparlegèneluxFdePhotobacterium.Figureempruntéeà(Grishin,2001)
FIG.1.2héliceα.–LactateDeshydrogénase(LDH)etFigureempruntéeà(Grishin,2001)HDANperoxydase.Transformationde3snirbβnefeuillet7ne
8Chapitre1.IntroductionFIG.1.3–Permutationscirculaires.(a)domaineC2delaSynaptotagmine(1rsy);(b)DomaineC2delaPhos-pholipaseC(1qas);Figureempruntéeà(Grishin,2001)
91.1.BanquesetClassifications1.1BanquesetClassications1.1.1BanquesdestructuresLabanqueprincipaledestructuresestlaPDB1-ProteinDataBank.C’estunebanquedestructuresprotéiquesounucléiques(oulesdeux)résoluesparcristallographieauxrayonsXouparRésonanceMagnétiqueNucléaire(RMN).Ellecontenaittenviron6000structuresen2000,23000en2006,maiselleesttrèsredondante(parexemple,ilyaplusde100lysozymes,dontbeaucoupdemutantsponc-tuelsdontlastructure3Dnechangepas).Cependant,pournaviguerparmilesstructuresilestsouventplusagréabled’utiliserlesitePDB-Sum2quicontientplusd’informationssurlesstructuresetleursséquencesainsiquedesliensavecd’autresbanques.Ilexistebeaucoupd’autresbanquescontenantdesinformationssurlesstructures.Parexemple,unebanquedessitesactifs(JOMPOAFINIR-voir3DMSS,catalogedessitesactifs),ouunebanqueclassantlesinteractionsprotéines-protéinesen3D.1.1.2ClassicationdesstructuresLesstructuressontgénéralementcatégoriséesenquatreclassesprincipalesquiontétédéfiniesparM.LevittetC.Chothia(LevittetChothia,1976):–«toutα»;–«toutβ»;–«α/β»(αetβmêlés);–«α+β»(αetβorganisésendeuxrégionsséparées).Unedespremièresclassifications-totalementmanuelle-aétécelledeJ.Richardson(Richardson,1981).Aujourd’hui,lesdeuxclassificationslesplusconnues-etutilisées-sontSCOP(Murzinetal.,1995)(StructuralClasssificationOfProteins)etCATH(Orengoetal.,1997)(pourClassArchitectureTopologyHomology,lesquatrepremiersniveauxdeclassification).SCOPetCATHsonttoutesdeuxdesclassificationshiérarchiquesdesdomainesstructurauxprotéiques.Lesstructuressontdoncdé-coupéesendomainesetsontensuiteregroupéesselonleursimilaritédeséquence,puisleursimilaritédestructure,puisleursimilaritéencompositionetorganisationdesstructuressecondaires.D’autresclassifications,cettefoisnonhiérarchiques,ontétécrééesaveccertainesdesméthodesprésentéesprécédemment:MMDB(Gibratetal.,1996;Madejetal.,1995)(MolecularModelingDataBase)-construiteavecleprogrammeVASTetquiestprésentesurlesitedelaPDB-,FSSP(HolmetSander,1996a)-construiteavecleprogrammeDALI(HolmetSander,1993)-etCEDatabase-construiteavecleprogrammeCE(ShindyalovetBourne,1998).Cescinqclassificationsvonticiêtreprésentéesainsiquequelquesautresclassificationsplusspécialisées.1.2Classicationshiérarchiques1.2.1SCOPLaclassificationSCOP(Murzinetal.,1995;Conteetal.,2002;Brenneretal.,1996)estfaitemanuellementd’aprèsdesinformationsstructuralesetdesconnaissancesplusgénéralessurchaque1URLhttp://www.rcsb.org/pdb/2URLhttp://www.ebi.ac.uk/thornton-srv/databases/pdbsum/
10Chapitre1.Introductionprotéine.Lesoutilsautomatiquesdecomparaisonstructuralenesontutilisésquepouraideràlaclas-sificationparinspectionvisuelle.Lesstructuresprotéiquessonttoutd’aborddécoupéesendomaines(régionsayantuncœurhydrophobeetpeud’interactionaveclerestedelaprotéine)puissontclassées.Lesquatreniveauxdeclassificationsont,duniveauleplusgénéralauplusfin:1.class:lacompositionenstructuressecondairesestsimilaire.IlyaquatreclassesprincipalesquisontlesmêmesquecellesdéjàcitéesetdéfiniesparLevittetChothia(1976).Les7autresclassesontuneffectifbeaucoupplusfaible.Lesclassesdesprotéinesmulti-domaines,despro-téinesmembranairesetdespetitesprotéinessontdevraiesclassesoùlesprotéinesontdesca-ractéristiquesspécifiquestandisquelesautressontplusdesartefactsdusauxméthodes(classedesprotéinesayantunefaiblerésolution,classedesprotéinesartificielles...);2.fold:lacompositionenstructuressecondaires(hélicesαetfeuilletsβ),leurarrangementspatialetleursconnexionssontsimilaires;3.superfamily:l’identitédeséquencepeutêtrefaiblemaislesstructuresetlesfonctionssuggèrentuneorigineévolutivecommune;4.family:lesstructuresprotéiquesontaumoins30%d’identitédeséquence,oubienpossèdentdesfonctionsetdesstructurestrèssimilaires.LabanqueSCOPestdoncuneclassification«manuelle»dedomaines,etladéfinitiondesdo-mainesestévidemmentcritiquepourcetteclassification.LaclassificationSCOPcontenaitenoctobre2004945classesauniveaufoldet1539classesauniveausuperfamily.1.2.2CATHLaclassificationCATH(Pearletal.,2005,2000;Orengoetal.,1997)esteffectuéeàlafoisau-tomatiquementetmanuellement.CommeSCOP,elleesthiérarchiqueetsubdiviséeenquatreniveauxprincipaux.Ellepossèdetroisniveauxsupplémentairesdeclassificationétablissurlasimilaritédesséquencesprotéiques.Lesniveauxdeclassificationsont:1.Classoùlesstructuressontregroupéesselonleurcompositionenstructuressecondairesetlescontactsentrecelles-ci.Ilyaquatreclasses:mainlyαetmainlyβquisontsimilairesauxdeuxclassesallαetallβdeSCOP,mixedαβetFewsecondarystructures.L’assignationd’unestructureàl’unedecesquatreclassesestautomatiquedans90%descas(les10%restantsontassignésàlamain)(Michieetal.,1996);2.Architectureoùl’organisationgénéraledesstructuressecondairesestlamêmepourlesstruc-turesd’unmêmegroupe.Cetteclassificationestfaitemanuellement,etnotammentparrapportàlaclassificationdeRichardson(1981);3.Topology:oùlesstructuresayantunmêmerepliemententermesdenombre,ordreetconnexionsdestructuressecondairessontregroupées.LaméthodedecomparaisondedeuxstructuresSSAP(TayloretOrengo,1989)estutilisée,avecunecontraintesurlalongueurdel’alignementetlescoreobtenu;4.Homologoussurperfamilyoùlesstructuresd’unmêmegroupeontdesstructuresetdesfonc-tionstrèssimilaires,suggérantunancêtrecommun.SSAPestaussiutilisé;5.Lesniveauxsupplémentaires-etimbriqués-S,N,Iregroupentlesstructuresayantuneidentitédeséquencerespectivement>35%,>95%etde100%(cedernierniveauregroupeenfaitlesprotéinesquiontétérésoluesplusieursfois,parexemplecomplexéesounonavecleurligand).L’algorithmed’alignementdesséquencesestceluideNeedlemanetWunsch.
1.2.Classificationshiérarchiques11Lesstructuressontdécoupéesendomainesstructurauxselonleconsensustrouvépartroismé-thodesindépendantes,DETECTIVE(Swindells,1995),PUU(HolmetSander,1994b)etDOMAK(SiddiquietBarton,1995).Silestroisméthodess’accordentpourlenombrededomainesetsi85%desrésidusd’undomainesontlesmêmes,ledécoupagedeDETECTIVEestchoisi,sinon,ledécou-pageestfaitàlamain(47%descas).Lesstructuresayantplusde30résidushorsdomainessontaussidécoupéesàlamain.Ledécoupageendomainesstructurauxn’esteffectuéquepourunestructurereprésentativedegroupeduniveauN,lesprotéinesdumêmegroupeayantplusde95%d’identitéhéritentdesmêmesdomaines.Lacohérencedudécoupageendomainesestvérifiéeauniveausupé-rieurS.Leprotocoledeclassificationaunpeuvariéaucoursdesannées(Pearletal.,2001).Pourajouterunenouvellestructureàlaclassification,cettestructureestcomparéeàlafoisauniveaudesaséquence(alignementcontrelesséquencesreprésentativesetcontredesprofilsPSSMdePSIBLAST)etdesastructure(auniveaupeptidiqueavecSSAPetauniveaudesstructuressecondairesavecGRATH(Harrisonetal.,2003)).DesalignementsmultiplesdesstructuressontréalisésaveclaméthodeCORA(Orengo,1999).L’assignationautomatiqueàuneclasse(Michieetal.,1996)commenceparladéterminationdesélémentsdestructuresecondaireparSSTRUCquiestuneimplémentationlocaledeDSSP(KabschetSander,1983).LesstructuressecondairessontensuitereprésentéespardesvecteursetlesdistancesinternesentreCαdedeuxstructuressecondairessontcalculés.Lenombredestructuressecondairesetlescontactsentrestructurespermetd’établirlaclassificationdelastructuredansl’unedesquatreclasses.En2005,CATHcontenait1467famillesauniveauHdont334possédaientaumoins3structuresavecmoinsde35%d’identité(Pearletal.,2005)et813classesauniveauT.CATHestdoncuneclassificationsemi-automatiquedesstructures.1.2.3FSSPLaclassificationFSSP(FamiliesofStructurallySimilarProteins(HolmetSander,1996b,1994a))estdifférentedesdeuxclassificationsprécédentescarellen’estpassubdiviséeendifférentsniveauxselondescritèresvariables.Ellepeutêtrereprésentéesousformed’unarbrequipeutêtrecoupéàdifférentsniveaux.ElleaétéconstruiteàpartirdesalignementsdeDALI(HolmetSander,1993).Laméthodeestassezsimple:elleconsisteàdécouperlesstructuresendomainesstructurauxpuisàcomparertouslesdomainesdeuxàdeuxavecDALI.UnalgorithmedeclassificationascendantehiérarchiquefondésurlesscoresdesalignementsdeDALI(averagelinkageclustering)permetensuitederegrouperlesdomainesenfamillesenconstruisantunarbre.CetarbreestcoupépourdifférentsZ-scoresdeDALIetainsisontforméeslesfamilles.Enréalité,DALIn’estpasutilisépourcomparerdirectementlastructurerequêteàtouteslesstructuresdelabanque.Dansunepremièreétape,laméthode3DLookUp(HolmetSander,1995),quicomparelesstructuresauniveaudeleursSSE,estutiliséepourcomparerlastructurerequêteaveclesstructuresreprésentativesdesfamillesdeFSSP.Ensuiteseulement,DALIestutilisépourcomparerlastructurerequêteaveclesstructuresdesfamillessélectionnées.Leproblèmeprincipaldecetteclassificationestqu’ellen’estpasmiseàjourrégulièrementetqu’elleestbeaucoupmoinssophistiquéequelesdeuxclassificationsprécédentes:iln’yapasdeliensavecd’autresbanquesdedonnéesnidemoyendevisualiserlesalignementsen3D(seulslesalignementsdespairesdeséquencessontfournis).
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents