Cette publication est accessible gratuitement
Télécharger
Surquelquesmod`elesde´volutiondes´equencesde nucleotidesavecde´pendanceduvoisinage ´
JeanB´erard(1)n-ea,JteisptBae´re´uoG(2)et Didier Piau(3)
(1)IsnilleJordtitutCaminU8srevMUna025R1´eitonLy (2)MU6RPAOMriMearot´edrsitnive628Usnae´lrOboLa (3)elbo1ni2Ursve´eitenGritsnI58R5UMerrioutFtu
1
Leproble`me
S´equences(spatiales)denucle´otidesA,C,GetT,delongueurnie ou infinie. ´ Evolution (temporelle) par substitutions (pas d’insertions ni de suppressions).
Danslesmod`elesclassiques,lestauxdesubstitutionnede´pendent quedunucl´eotideausiteconsid´er´e.
Parcons´equent,
chaquesiteevolueind´ependammentdetouslesautres, ´ leshistoriquesdessitesre´alisentdescopiesinde´pendantesdun processus markovien, – chaque copie converge en loi vers la mesure stationnaire, etlase´quenceconvergeenloiversleproduitdesmesures stationnaires.
2
Mais on sait bien que s o erv (a)lesfr´equencebs´eesnesontpasdesproduits, (b)etdailleurs,lestauxdesubstitutionenunsited´ependentaussi des voisins du site.
Unexempleconnuetmassif:lesıˆlotsCpG.
CmuteversT[jusqua`]10foisplussouventquandCfait partie de CG. (Donc)GmuteversA[jusqu`a]10foisplussouvent quand G fait partie de CG.
3
Formeg´ene´raledumode`le
Tauxdesubstitutiondunucle´o
Tauxdesubstitutiondunucle´o tidexversx0en chaque site :
Coˆnedinuence
τ(x x0|yxz)
Lesfre´quencesstationnairesF(xfresqu´eceense´d)dnepdtneF(yxz). Lesfr´equencesF(yxzs-selletnedsemeˆm)d´ependeF(uyxzv). Und so weiter. . .
4
...donconestcoinc´e.
Re´solutionapproch´eedunmode`leavecsubstitutions «desblou»´ieeasxupClG
Laurent Duret et Nicolas Galtier,Molecular Biology and Evolution (2000):mod`eledeTamuraa`2param`etres+CpGversCpAet CpG vers TpG a ˆme ta u me ux.
Ici, lesF(xnepetned´d)desF(xy). LesF(xynedtsed)e´epdn F(xyz), etc.
Id´ ee :
F(xyz)F(xy)F(yz)F(y) ()
Remarques : (1) Dans un autre contexte :Bethe Ansatz, approximation de Kikuchi, . . . (2) La formule (ceahıˆenedaMkr)vsoeraitexactepourun (spatiale).
5
Sous ()s,1ler´6fueeqesncF(xy) deviennent les solutions d’un t`emenon-line´aireautonome. sys
Donconpeutre´soudre,aumoinsnume´riquement,etlere´sultat ressemblea`peupr`esa`uneloideprobabilit´e.
[DuretetGaltier]Lafre´quencedeTpAest´egalementmodi´ee, sansinterventiondem´ecanismesauxiliaires.
Ve´rication:parsimulations(sic).
Boıˆteline´airenieoucerclediscret:quelrapportaveclesyst`eme sur la droite ?
6
A cautionary tale
Mod`eleduvotant:sommetidansSte´,ats(i) =±. ´ Evolution :s(i) change au tauxd(i) := #{ji;s(j)6=s(i)}.
Destin en temps grand :
SiSest fini,Sdevient unicolore puis le reste.
SiS=Z, jusqu’au tempstinetıˆob-suoset1et,eudoSest : – unicolore pendant un tempsto(t), – en deux parties unicolores pendant un temps infini, – autre pendant un temps fini, – toujours de nouveau unicolore + et unicolore.
7
Unresume´delasuitedelexpos´e: ´
Pour(uneassezvasteextensionde)cemode`le, (a)lesyste`meconvergeversunemesurestationnaire unique, qui est invariante par les translations (spatiales), (b) on peut calculer exactement ses marginales (la fr´equencea`le´quilibredechaquepolynucl´eotide), (c)cettemesureve´riedefortespropri´ete´s(impre´vues) dind´ependance.
8
Construction d’une dynamique par processus de Poisson ponctuels
= substitutions«simples».
τ(x y) = taux de substitution dexversy.
Attention :on autorise des substitutions simples (virtuelles) dex versx. Donc chaqueτ(x xamartr`ees)nptubile.er
F= substitutions«doubles»de CpG vers CpA et de CpG vers TpG.
Onveutrepr´esenterlhistoriquedunecollectionniedesites.
9
T
C
10
T
T
T C
A G
C C
G
C
11
T
G
A
C
T
C
G