Sous la direction de Hélène Jacquemin-Sablon Thèse soutenue le 17 décembre 2009: Bordeaux 2 Le gène unr (upstream of N-ras) code une protéine de liaison à l’ARN, Unr, qui régule la stabilité et la traduction d’ARN messagers cibles. L’invalidation du gène unr chez la souris conduit à une létalité embryonnaire à mi-gestation (10,5 jours post-coitum, jpc). Unr est donc essentielle pour le développement de la souris. Le phénotype le plus frappant des embryons unr-/- est leur petite taille qui est déjà visible à 8,5jpc. Ce phénotype pourrait refléter un problème précoce de prolifération/différenciation au cours du développement qu’il est possible d’étudier dans les cellules souches embryonnaires (ES). Les cellules ES sont dérivées des cellules pluripotentes des embryons au stade blastocyste (3,5jpc). Les cellules ES peuvent s’auto-renouveler c’est à dire proliférer indéfiniment sous forme non différenciée ce qui correspond à leur état pluripotent ou différencier en tous les types cellulaires (lignages) adultes dérivés des feuillets primordiaux (endoderme définitif, mésoderme et ectoderme) ce que défini la pluripotence. Ces deux propriétés des cellules ES conditionnent leur devenir et définissent leur identité. Nous avons remarqué que les cellules ES unr-/- ont tendance à différencier spontanément alors qu’elles sont cultivées dans des conditions qui les maintiennent dans un état non différencié et prolifératif (état pluripotent). En routine, les cultures de cellules ES unr-/- contiennent environ 25% de cellules morphologiquement différenciées. Nos travaux montrent en effet, qu’elles différencient en endoderme primitif. Nous avons reproduit ce phénotype dans une autre lignée des cellules ES de fond génétique différent par déplétion stable d’Unr. La restauration de l’expression d’Unr dans les cellules ES unr-/- limite fortement leur engagement en différenciation. Unr contribue donc au maintient de l’état pluripotent des cellules ES en prévenant leur différenciation spontanée vers le lignage endodermique primitif (Epr). Ce tissu au cours du développement va former l’épithélium de la poche embryonnaire ou sac vitellin. Nos données préliminaires montrent que les cellules ES en absence d’Unr maintiennent tout de même leur capacité de différenciation multi-lignages (endoderme définitif, mésoderme et ectoderme) quand celle-ci est induite. Ensuite, nous nous sommes intéressés au(x) mécanisme(s) d’action d’Unr. Nous avons fait l’hypothèse qu’Unr pourrait directement agir en régulant positivement des gènes qui inhibent la différenciation des cellules ES en Epr ou en régulant négativement des gènes qui l’induisent. Nous avons identifié le gène gata6 comme cible potentielle d’Unr. Une augmentation modérée de l’expression du facteur de transcription Gata6 dans les cellules ES conduit à une autorégulation positive du gène gata6 et induit la différenciation des cellules ES en Epr. Nos données suggèrent qu’Unr pourrait directement déstabiliser les ARNms Gata6 dans les cellules ES afin de prévenir leur différenciation spontanée en Endoderme primitif. -Unr -Etat pluripotent -Stabilité -Cellules souches embryonnaires (ES) -Pluripotence -Différenciation spontanée -Gata6 -Endoderme primitif -ARN messagers Unr (upstream of N-ras) is a cytoplasmic RNA-binding protein with cold shock domains, involved in regulation of messenger RNA stability and translation. Unr is essential to mouse development since Embryos deficient for Unr die at mid-gestation. Here we report that unr knockout ES cells maintained under growth conditions that sustain self-renewal spontaneously differentiate toward the primitive endoderm (PrE) lineage. This phenotype was reproduced in another ES line (E14tg2a) after shRNA-induced Unr depletion. Moreover, Unr rescue in Unr-deficient ES cells limits their PrE differentiation engagement. However, Unr is dispensable for multilineage differentiation, as shown by knockout ES cells capacity to produce differentiated teratomas. We further investigated the molecular mechanisms underlying the differentiation of unr-/- ES to primitive endoderm, and found that Unr acts downstream of Nanog. Our data also show Gata6 mRNAs are more stable in Unr-deficient ES cells as compared to wild-type ES cells. We propose that the possible repression by Unr of this key inducer of PrE differentiation at a post-transcriptional level may contributes to the stabilization of ES cells pluripotent state. Source: http://www.theses.fr/2009BOR21681/document
DOCTORAT DE L’UNIVERSITÉ BORDE Mention : Biologie-santé Option : Biologie cellulaire et physiopathologie Présentée et soutenue publiquement Le 17 Décembre 2009 ParHabiba ELATMANINée le 18 Septembre 1981 à Vernon (27)
Caractérisation du rôle d’Unr, une protéine de liaison à l’ARN, dans les cellules souches embryonnaires murines Membres du Jury M CULLIN Christophe........................................................................PrésidentProfesseur de l’Université Bordeaux II Mme MORELLO Dominique..............................................................Rapporteur Directeur de recherche CNRS, Université Toulouse III M AVNER Philippe...............................................................................RapporteurDirecteur de recherche CNRS, Institut Pasteur M LE MENUET Damien......................................................................Examinateur Chargé de recherche INSERM, Université Paris XI Mme JACQUEMIN-SABLON Hélène................................................Directeur de thèse Chargé de recherche INSERM, Université Bordeaux II
1
APAF-1: Apopstic Protease-Activating Factor 1 ARE: AU-rich elements ARE-BPs: ARE Binding Proteins ARN: Acide RiboNucléique ARNm (s): ARN messager (s) ARNt: ARN de transfert CSD: Cold Shock Domain CSPs: Cold Shock Proteins DCC: Dosage Compensation Complex Dcp1/2/S: Decapping protein 1/2/S E: jour Embryonnaire eEF1A: eukaryotic Elongation Factor A eIF2: eukaryotic Inition Factor 2 eIFs :eukaryotic Initiation Factors Epi: Epiblaste Epr: Endoderm primitif ES: Embryonic Stem IRES: Internal Ribosome Entry Site ITAFs: IRES Trans Acting Factors JAK: Janus Kinase Kb: Kilobase KDa: KiloDalton LIF: Leukemia Inhibitory Factor MCI: Masse Cellulaire Interne miARN: microARN mCRD: major Coding Region of Determinant of instability miRNP (s): miARN RiboNucleoProteic complex (s) Msl-2: Male specific lethal-2 PABP: PolyA Binding Protein
PAIBP1: PABP Interacting Protein 1 PABPII: PolyA Binding Protein II
2
PAP: PolyA Polymérase PARN: PolyA-specific RiboNuclease pb: paire de base pré-ARNm (s): ARN pré-messager (s) Pré-miARN (s): précurseur miARN (s) Pri-miARN (s): miARN (s) primaire (s) PTB: Polypyrimidine Tract Binding protein PTH: Parathyroid Hormon RBP: RNA Binding Protein RISC: RNA Induced Silencing Complex RRM: RNA Recognition Motif SMG: Smaug Sxl: Sex lethal TE: Trophectoderme unr:Upstream of N-ras(gène) 3’NT: Region 3’ Non Traduite
5’NT: Region 5’ Non Traduite
3
Introduction.6
I) Unr, une protéine de liaison à l’ARN impliquée dans la régulation post-transcriptionnelle de l’expression des gènes. ...................................................................................................... 71) Le gèneunrcode une protéine de liaison à l’ARN conservée au cours de l’évolution. 7A) Découverte du gène unr: upstream of N-ras. ............................................................ 7a) Historique. .............................................................................................................. 7b) Le gène unr code une protéine à cinq domaines « cold- shock ». ......................... 8B) Les protéines à domaine cold shock chez les procaryotes et les eucaryotes. ............ 8a) Structure du domaine cold shock. .......................................................................... 8b) Les protéines à domaine cold- shock chez les procaryotes.................................... 8c) Les protéines à domaine cold-shock chez les eucaryotes. ..................................... 8
2
C) Unr, une protéine de liaison à l’ARN ubiquitaire et conservée au cours de l évolution. ................................................................................................................... 10’ a) Rôle Fonctionnel et localisation subcellulaire de la protéine Unr. ...................... 10b) Conservation d’unr au cours de l’évolution......................................................... 10c) L’expression d’unr est ubiquitaire. ...................................................................... 10)Unr participe à la régulation post-transcriptionnelle de l’expression des gènes. ..... 11A)Introduction aux régulations post-transcriptionnelles de l’expression des gènes chez les eucaryotes. ...................................................................................................... 11a) Vue générale des différents niveaux de régulation de l’expression des gènes. ... 11b) Les régulations post transcriptionnelles de l’expression des gènes ..................... 12B) .......................................... 13des ARNms : traduction et dégradation.Le devenir a) Modifications post-transcriptionnelles du pré- ARNm : ajout de la coiffe 5’ et de la queue polyA. ........................................................................................................ 13b) La traduction des ARNms.................................................................................... 13b1) L’initiation de la traduction coiffe dépendante. ................................................. 14b2) La traduction dépendante d’IRES. ..................................................................... 15c) Dégradation des ARNms...................................................................................... 15c1) Enlèvement de la queue polyA. ......................................................................... 15c2) Enlèvement de la coiffe 5’. ................................................................................ 16C) Modes de régulation de la traduction et de la stabilité des ARNms. ...................... 17a) Régulations post-transcriptionnelles par les microARNs. ................................... 17b) Régulation post-transcriptionnelle par les éléments AU-rich .............................. 20D) UNR régule la stabilité et la traduction d’ARNms. ................................................ 21a) Régulation de la stabilité des ARNms. ................................................................ 21b) Régulation traduction dépendante d’IRES........................................................... 23
4
c) Régulation de la traduction coiffe dépendante..................................................... 23E) Régulations post-transcriptionnelles et développement : Unr essentielle pour le développement de la souris .......................................................................................... 25a) Détermination des axes de l’embryon de drosophile par une succession d’inhibition de traduction. ........................................................................................ 25b) La protéine Unr est essentielle pour le développement embryonnaire de la drosophile et de la souris. ......................................................................................... 26b1) Unr et dosage génique compensatoire du chromosome X chez la drosophile... 26b2) Le gène unr est essentiel pour le développement de la souris. .......................... 27II) Développement embryonnaire précoce de la souris et cellules souches embryonnaires murines. ................................................................................................................................ 301) Le développement embryonnaire précoce chez la souris. ........................................... 30A) De la fécondation à la formation du blastocyste ..................................................... 30a) Clivage de l’embryon, compaction et formation du blastocyste. ......................... 30b) Spécification des premiers lignages cellulaires. .................................................. 32b1) Ségrégation du trophectoderme et de la masse cellulaire interne ...................... 33b2) Ségrégation de l’endoderme primitif et de l’épiblaste. ...................................... 34B) De l’implantation à la gastrulation. ......................................................................... 36a) Implantation et formation de l’œuf cylindre ........................................................ 36b) La gastrulation: différenciation de l’épiblaste, formation des feuillets primordiaux .............................................................................................................. 372) 39Les cellules souches embryonnaires murines...........................................................A) Description des cellules souches embryonnaires. ................................................... 39a) Propriétés des cellules souches embryonnaires.................................................... 39b) Culture des cellules ES murines. ......................................................................... 41B) Etablissement, maintien et régulation de la pluripotence........................................ 41a) Identification de gènes clés de pluripotence: oct4, sox2 et nanog. ...................... 41a1) Oct4 .................................................................................................................... 41a2) Sox2.................................................................................................................... 42a3) Nanog. ................................................................................................................ 42b) Circuit transcriptionnel de régulation de la pluripotence..................................... 45c) MicroARN et cellules ES..................................................................................... 46
C’estaucoursd étudesintensivesvisantàcaractériserlepr moteurdu gène N-rasque le gèneunraété découvert. Deux équipes qui travaillaienl’unechezleratet l’autre chezl’ho me,ontsimultanémentmisenévidenceune unité transcriptionnelleactivelocaliséeimmédiatementenamontdug neN-ras, qui a été nomméeunr pourstreamofN-ras(1, 2). Les locusunr et-ras un constituent tandemdegènes danstra scritslamêmeoenriitatnochezl’hom eetlesrongeurs,ladistanceteinuqinégrétantpaeremtntrciluèicourte(150pb chezl’hommeet130pbchez la souris). Leèneunr esttranscritentroisARNmess gers(ARNms)quidiffèrentparleurextrémité3’(1, 2). En effet, troissé uencessignaldepolyadénylation,A1,A2etA3,sontsituéesdanslarégion3’notraduite(3’NT)à1Kb,450pbet150pcepsertnemevitduprincipalsited’initiatiodelatrapiitsnrcnodu gène N-ras( 1Figu e). Ces éléments impliquent que leprom teurdugèneN-ras estenpartiecontendanslegèneunr. L’expressionubiquitai edecetandemdegènes,ainsiquelaendance des transcrits N-ras à êtremoinsabondants que les transcritsUnr,aconduitàl’hypothèsed’uneinterférencetransc iptionnelleauseindecelocus.End’au restermes,latranscriptiond’unrlimiterait’accèsde la région romotricedugène-rasàlameirenihcadetranscription.Cepe dant,ils’estavéréquecetteinterférencétaitfaibleetneconstituaitpasunméca ismemajeurdelarégulationtranscripti nnelledel’expressiondeN-ras(3).
Figure1:Organisationdulocusunr/N-ras(3).
7
b)Le gène unr code une protéine à cinq domaines « cold- shock ».
Le gèneunr code chez l’homme une protéine présente sous deux isoformes, une mineure et une majeure de 798 et 767 acides aminés respectivement, issues de l’épissage alternatif de l’exon 5(4). Les formes majeure et mineure ont une masse moléculaire respective d’environ 85 et 88 KDa. Lors de la découverte du gèneunr, l’alignement de sa séquence protéique contre les bases de données n’a mis en évidence aucune homologie avec des protéines connues(1, 2). Seule la recherche de motifs conservés et la modélisation de la structure secondaire de la protéine Unr ont montré qu’elle appartient à la famille des protéines à domaine « choc froid » ou cold-shock(5, 6). Ce domaine, très conservé au cours de l’évolution est décrit chez les procaryotes et les eucaryotes, il constitue un domaine de liaison aux acides nucléiques simples brins.
B)Les protéines à domaine cold shock chez les procaryotes et les eucaryotes.
a)Structure du domaine cold shock.
Le domaine cold shock (CSD) est un domaine de liaison aux acides nucléiques, d’environ 70 acides aminés, très conservé au cours de l’évolution. La structure secondaire du CSD correspondant à cinq feuilletsβantiparallèles qui se replient dans l’espace en un tonneauβ(7, 8). Cette structure tridimensionnelle est semblable à celle des domaines de liaison à l’ARN RRM (RNA Recognition Motif) présents dans de nombreuses protéines de liaison à l’ARN (RBPs, RNA Binding Proteins). De plus, le CSD renferme deux motifs conservés de liaison aux acides nucléiques simples brins, RNP1 et RNP2 (huit et six acides aminés respectivement) caractéristiques des domaines RRM(9-11).
b)Les protéines à domaine cold- shock chez les procaryotes.
Chez les bactéries (dont certainesarchaebactéries), la majorité des protéines à domaines cold shock sont induites suite à un choc froid. Elles constituent la famille des protéines de choc froid ou CSPs (Cold Shock Proteins) qui possèdent toutes un unique domaine CSD. Chez les bactéries, les protéines contenant un CSD constituent 10 % des protéines synthétisées après un choc froid. Elles permettent aux bactéries de s’adapter à la baisse de température et de reprendre ainsi leur croissance. En effet, le choc froid stabilise les structures secondaires de l’ARN et de l’ADN ce qui rend difficile le travail des ARN et ADN polymérases. Les CSPs vont agir comme des chaperonnes de l’ADN et de l’ARN, elles vont déstabiliser ces structures secondaires et permettent ainsi la reprise de la réplication, de la transcription et de la traduction(12).
c)Les protéines à domaine cold-shock chez les eucaryotes.
Chez les eucaryotes, à la différence des procaryotes, les protéines à CSD ne sont pas induites à la suite d’un choc froid. Elles participent à des processus biologiques divers tels que la prolifération, la résistance aux drogues et le développement. Chez 8
les eucaryotes, lesp otéinesàCSDsontdesprotéinesdeliais nàl’ARNet pour certainesconstituentégalementdesfacteursdetranscription.P usieursfamillesderotéinesàCSDso tdécriteschezleseucaryotestelsquelaamilledeprotéineY-box, lesprotéinesIN28 (LIN28a et LIN28b),lesprotéinesric esenglycinechezlesplantesetUnr.LeurdomaineCSDestassociéàdesd mainesprotéiquesadditionnels,telsqudesilotsiques/sramotabsaqieuchezlafa illedesprotéines Y-box de vertébré (13) ou des doigts de zinc danslarotéineLIN28deC.elegans(14) etdanungroupedeprotéines richesenglycineshezlesplantes(15). Cesdomainescompl mentairesleurconfèrentuneplusgrandespécificité de substrat ou une fonctionen ymatiquesupplémentaire(16, 17). Unrfaitfigured’exceptiondanscettefamillepr téiquepuisqu’ellepossèdecinqCSD (Figur2).
LesprotéinesdelafamilleY- oxchezlesvertébréssontdeloinlesprotéinesàCSDlesplusétudi es.Ellesontétédécritesàl’originecom edesfacteursdetranscriptionselianàl’ADNsurlesboîtesYprésentesauiveaudesrégionspromotricesdegèn scibles(18).Depuis,leurimplicationd nslestockage,larégulationdeladem -vie et de la traduction d’ARNms ont faitl’ bjetdenombreusesétudes. YB-1estleembredecettefamilleleplusétudiéetset ouveêtreàcejourlaprotéinedeliaisonauxacidesnucléiqueslaplusconservéeaucoursdel’évolution.Cettedernièrepartic peàdesfonctionscellulairesvariéestellesquelaproliférationcellulaire,larésis anceauxdrogues,laréparationde l’ADNouencorel’épissage(19).