Proposition de stage de developpement d outils logiciels pour l etude  de phylogenie moleculaire
3 pages
Français

Proposition de stage de developpement d'outils logiciels pour l'etude de phylogenie moleculaire

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
3 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Proposition de stage de developpement d’outilslogiciels pour l’etude de phylogenie moleculaireVersion du 8 avril 2008DESCRIPTIFL’utilisation de grappes de calcul informatique (clusters), c’est a dire desystemes informatiques ou les tac^ hes sont reparties simultanement ou tem-porellement entre plusieurs processeurs, se generalise en bio-informatique.On attend de ces clusters un gain de temps consequent en matiere de calculscomplexes. Un des domaines ou^ les clusters apparaissent prometteurs estcelui de la reconstruction de phylogenies, c’est a dire la reconstruction desrelations de parente entre des organismes vivants, plantes, animaux ou bac-teries. Depuis le milieu des annees 90, le developpement de la systematiquemoleculaire a ete rendu possible par la popularisation des techniques d’am-plication selective de fragment de genes (PCR) et la disponibilite d’outilsde sequen cage automatique.Il est desormais relativement aise d’obtenir pour un grand nombre d’or-ganismes (individus ou especes) des sequences de nucleotides issues de l’ana-lyse de plusieurs genes mitochondriaux ou nucleaires. Les jeux de donnees enphylogenie moleculaire s’accroissent donc de maniere quasi exponentielle, cequi a des consequences en matiere de traitement informatique de ces donnees.Classiquement, la reconstruction de genealogies d’individus ou de taxonsse fait via trois types d’approches analytiques destinees a identi er ...

Sujets

Informations

Publié par
Nombre de lectures 32
Langue Français

Extrait

Propositiondestagedede´veloppementdoutils logicielspourle´tudedephylog´eniemole´culaire
Version du 8 avril 2008
DESCRIPTIF Lutilisationdegrappesdecalculinformatique(clusters),cest`adirede syst`emesinformatiqueso`ulestˆachessontre´partiessimultane´mentoutem-porellemententreplusieursprocesseurs,seg´en´eraliseenbio-informatique. Onattenddecesclustersungaindetempscons´equentenmatie`redecalculs complexes.Undesdomainesoˆulesclustersapparaissentprometteursest celuidelareconstructiondephylog´enies,cest`adirelareconstructiondes relationsdeparent´eentredesorganismesvivants,plantes,animauxoubac-t´eries.Depuislemilieudesann´ees90,led´eveloppementdelasyste´matique mol´eculairea´et´erendupossibleparlapopularisationdestechniquesdam-plications´electivedefragmentdege`nes(PCR)etladisponibilite´doutils dese´quenc¸ageautomatique. Ilestd´esormaisrelativementaise´dobtenirpourungrandnombredor-ganismes(individusouespe`ces)desse´quencesdenucl´eotidesissuesdelana-lysedeplusieursge`nesmitochondriauxounucle´aires.Lesjeuxdedonn´eesen phylog´eniemol´eculairesaccroissentdoncdemani`erequasiexponentielle,ce quiadescons´equencesenmati`eredetraitementinformatiquedecesdonne´es. Classiquement,lareconstructiondege´n´ealogiesdindividusoudetaxons sefaitviatroistypesdapprochesanalytiquesdestin´ees`aidentierlarbre optimal,cest-a`-direlatopologiequirendracompteaveclepluspre´cision possiblelesrelationsdeparent´eentrelesorganismes´etudi´es: Lam´ethodedeparcimoniequirecherchelarbrelepluscourt,cest-a`-direquiminimiseraleschangementsd´etatsdecaract`eres. Lam´ethodedemaximumdevraisemblance,m´ethodeprobabilistequi rechercheralarbreleplusvraisemblableenfonctiondesdonn´eeset dunmode`led´evolutionmole´culaireadapt´e`acesdonne´es. Linf´erencebay´esienne,autrem´ethodeprobabilistebase´esurlesti-mationdesprobabilit´espost´erieuresdedistributiondarbres.Cette
1
probabilit´eposte´rieuredesarbresestcalcul´eeviaunetechniquedesi-mulationdetypeMCMC(MarkovChainMonteCarlo).Ilestla`aussi tenucomptedunmode`lede´volutionmole´culairede´nia`partirdujeu dedonn´ees.
Lesdeuxpremi`eresapprochesatteignentrapidementleurslimitespra-tiquesentermesdetempsdecalcullorsquelesjeuxdedonne´escroissent, mˆemesiplusieurse´quipesseorcentdemettreaupointdesalgorithmesde vraisemblanceplusrapides.Linf´erencebaye´siennesestpopularise´eaucours destroisderni`eresann´eesdufaitdelarapidite´desesalgorithmesdecalcul etdufaitdelapossibilit´ededistribuerlescalculssurplusieursprocesseurs travaillant ensemble. C’est le cas notamment du logiciel MrBayes.
Notre´equipe,ainsiquedautresgroupesderechercheduL.E.G.S.,impli-qu´eedanslareconstructionphyloge´n´etique`apartirdedonne´esdes´equences asouhaite´optimiserleprocessusdereconstructionphyloge´ne´tiquevialac-quisitiondunclusterdecalculsusceptibleder´eduiresignicativementles tempsdecalculsne´cessairesa`lobtentiondestopologiesoptimales.
OBJECTIFS Porter,d´evelopperouoptimisersurunedesdeuxgrappesdecalculdu laboratoiredesoutilsdereconstructiondarbresphylog´en´etiquesinclusou non dans la suite logicielle bio-informatique Bioteam Inquiry. Certains ou-tilslogicielspermettantlalignementdes´equencesoulanalysededonn´ees dege´n´etiquedespopulationspourrontaussiˆetreprisencompte.Unein-terfacefacilitantlechoixraisonne´desoutilsetleurutilisationpourraeˆtre propos´ee.Lesoutils`autiliserserontceuxdelasuiteded´eveloppementsGnu ou Xcode d’Apple, ainsi que les librairies MPI, SGE ou Xgrid. L’ensemble desnouveauxcodesde´velopp´esserasouslalicencelibreCeCIL.
Lesprogrammesousuiteslogiciellesconcerne´sserontlessuivants:PAUP, POY, PAML, PHYLIP, MrBayes, PHYML, HYPHY, EMBOSS, ClustalW-MPI, Mesquite, R.
2
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents