La lecture en ligne est gratuite
Télécharger
 
MINISTERE DE L’EDUCATION NATIONALE, DE LA RECHERCHE ET DE LA TECHNOLOGIE  ECOLE PRATIQUE DES HAUTES ETUDES Sciences de la Vie et de la Terre
MEMOIRE présenté par Véronique ROUX
pour l’obtention du diplôme de l’Ecole Pratique des Hautes Etudes
   CONCEPTION ET MISE EN PLACE D’UN PROCESSUS D’ASSURANCE QUALITE POUR L’UTILISATION DE LA TECHNOLOGIE MICROARRAY SUR UNE PLATE-FORME DE GENOMIQUE FONCTIONNELLE  Soutenu le 13 janvier 2006 devant le jury suivant :  Pr Andràs PALDI   P  résident Pr Stéphane RICHARD   R apporteur Dr Ivan BIECHE Examinateur Dr Vladimir LAZAR Examinateur  Laboratoire de Génétique Oncologique - UMR 8125: Directeur : Pr. S. RICHARD                                                                                                stephane.richard@kb.u-psud.fr Faculté de Médecine Paris Sud Le Kremlin Bicêtre -et Institut Gustave Roussy - Villejuif E.P.H.E. (Sciences de la Vie et de la Terre)  Unité de Génomique Fonctionnelle : Responsable : Dr. V. LAZAR                                                                                                       lazar@igr.fr Institut Gustave Roussy – Villejuif  
ECOLE PRATIQUE DES HAUTES ETUDES Sciences de la Vie et de la Terre
 
  CONCEPTION ET MISE EN PLACE D’UN PROCESSUS D’ASSURANCE QUALITE POUR L’UTILISATION DE LA TECHNOLOGIE MICROARRAY SUR UNE PLATE-FORME DE GENOMIQUE FONCTIONNELLE  Véronique ROUX 2006  La technologie microarray permet de mesurer simultanément et quantitativement l’expression relative de plusieurs milliers de gènes. En effet, une première approche d’étude fonctionnelle d'une cellule peut être définie par l'ensemble des gènes qui s'y expriment à un instant donné, c'est-à-dire par son transcriptome. L’enjeu majeur dans la réalisation d’un projet de puces microarrays est de pouvoir garantir la fiabilité du processus, tout en augmentant les performances et en assurant la sécurité analytique de l’ensemble. L’établissement d’un processus de contrôle de qualité a été mis en place, permettant de visualiser les produits en cours de production et de contrôler des étapes importantes du processus. Un concept innovant a ainsi été mis en place, pour rendre plus performant le contrôle qualité des ARN et de la synthèse des cibles avant l‘étape d’hybridation. Ce nouveau concept est basé sur l’utilisation du bioanalyseur Lab-on-Chip, combiné avec la PCR quantitative en temps réel, qui est utilisée pour surveiller plusieurs étapes au cours de la production. Chaque étape est verrouillée par des indicateurs de qualité utilisant différentes technologies, qui doivent être validés avant de poursuivre le processus de réalisation de lames microarrays. L’ensemble de ces mesures a permis d’aboutir à des résultats fiables et reproductibles, validant le concept d’assurance qualité sur notre plate-forme.  Mots-clés : Transcriptome, Microarrays, Assurance contrôle qualité.
 SOMMAIRE    ABREVIATIONS .. 1  INTRODUCTION .. 2  1.      Généralités . 2
1.1.      Place de la génomique fonctionnelle dans la recherche . 2 1.2.      L’unité de Génomique Fonctionnelle à l’Institut Gustave Roussy . 5 1.3.      Généralités sur la technologie microarray . 6 1.4.      Les différentes technologies microarray . 7  1.4.1.        Le support 7  1.4.2.        Le système de détection . 7  1.4.3.        Le type de séquences sur les spots . 8  1.4.4.        La fabrication des puces . 9  1.5.      Présentation de la technologie microarray utilisée au sein de l’UGF . 9  2.      Problématique . 11  3.      Mise en place d’indicateurs de qualité . 12 3.1.      Définition des indicateurs de qualité . 12 3.2.      Conséquence de la lecture des indicateurs sur le flux de production . 12 3.3.      Localisation des indicateurs de qualité . 13  4.      Objectifs . 16  REFERENCES BIBLIOGRAPHIQUES .. 17  
  ABREVIATIONS  
°C : degré Celcius µg : microgramme µl : microlitre µm 2 : micromètre carré  22K : 22 000 sondes 44K : 44 000 sondes AACR : American Association for Cancer Research ADN : Acide DésoxyriboNucléique ADNc :ADN complémentaire ARN : Acide RiboNucléique ARNc : ARN complémentaire (anti-sens)
ARNm : Acide RiboNucléique messager ARNr : Acide RiboNucléique ribosomal ERBB2 : v-erb-b2 erythroblastic leukemia viral oncogene homolog 2, neuro/glioblastoma derived oncogene homolog (avian) CI T : carte d’identité des tumeurs CGH : Comparative Genomic Hybridization 2 cm : centimètre carré CNRS : Centre National de Recherche Scientifique CQ1 : contrôle par PCR Quantitative n°1 CQ2 : contrôle par PCR Quantitative n°2 Ct : Threshold cycle (cycle seuil) CTP : Cytidine Triphosphate Cy3 : Cyanine 3 Cy5 : Cyanine 5 DNase : DésoxyriboNucléase dNTP : déoxy Nucléotide TriPhosphate DTT : DithioThréitol g : Force Relative de Centrifugation (FRC) HES : Hématoxyline Eosine Safran IC : Indicateur de qualité : Institut Fédératif de Recherche IFR IGR : Institut Gustave Roussy INSERM : Institut National de la Santé et de la Recherche Médicale  Transcription in vitro IVT : Kb : kilo base LIMS : Laboratory Information Management System mg : milligramme MIAME : Minimal Information About a  Microarray  Experiment ml : millilitre mM : millimolaire MMLV-RT : Moloney Murine Leukemia Virus Reverse Transcriptase ng : nanogramme  nm : nanomètre pb : paire de base PCR : Polymerase Chain Reaction PEG : PolyEthylène Glycol pmol : picomole PPIA : peptidylprolyl isomerase A (cyclophilin A) RPLPO : ribosomal protein, large, P0 RT2 : Reverse Transcription n°2 (Transcription Inverse n°2)
SSC : Saline Sodium Citrate Tm : Température de fusion UGF : Unité de Génomique Fonctionnelle
   
 INTRODUCTION  
1.    Généralités  
1.1.         Place de la génomique fonctionnelle dans la recherche  Grâce au programme de séquençage du génome humain, le décryptage de l’information génétique au niveau de l’ADN (Acide DésoxyriboNucléique) publié en avril 2003 [9 et 17] , ouvre la voie des études de génomique structurelle et permet la recherche du niveau d’expression des gènes (génomique fonctionnelle). L’enjeu réside désormais dans la caractérisation de la fonction des gènes et des voies de régulation. Cela permet de définir les processus biologiques dans lesquels ils sont impliqués. Afin de répondre aux besoins d’une exploration par des analyses fonctionnelles, des stratégies innovantes et des outils se sont développés systématiquement à l’échelle du génome.  En effet une première approche d’étude fonctionnelle d'une cellule peut être définie par l'ensemble des gènes qui s'y expriment à un instant donné, c'est-à-dire par son transcriptome : ensemble des ARN messagers (ARNm). Le génome contient environ 26 000 gènes différents dont la fonction biologique reste cependant encore inconnue pour un grand nombre d’entre eux. Le processus de transcription et maturation (épissage) permet de produire à partir d’un gène plusieurs ARNm (de quelques copies à plusieurs dizaines de milliers de copies). Chaque type cellulaire présente un profil d’ARNm ou transcriptome qui représente les informations relatives à l’état physiopathologique de la cellule, constituant ainsi une « signature » moléculaire.  Les protéines issues de la traduction des ARNm subissent une maturation post-traductionnelle, ajoutant ainsi un degré de complexité supplémentaire.
 L’ensemble des protéines à un instant donné représente le protéome potentiellement constitué environ de 300 000 à 10 6 protéines.  La capacité de développer des méthodes et des stratégies capables d’interroger et d’analyser l’énorme masse d’informations qui peut être générée est l’une des raisons du succès rencontré aujourd’hui, en génomique fonctionnelle. Une des technologies utilisées pour l’étude du transcriptome est nommée « DNA  microarray  » et par extension microarray (puce à ADN en français).  1.2.         L’unité de Génomique Fonctionnelle à l’Institut Gustave Roussy  L’Institut Gustave Roussy (IGR) est un établissement de santé privé à but non lucratif dédié au traitement des cancers. Il assure des missions de prévention, de recherche, d’enseignement et de soins.  Les activités de recherche sont regroupées sous l’autorité d’un Institut Fédératif de Recherche (IFR 54) qui accueille des équipes et services communs propres à l’IGR, ainsi que des équipes associées au CNRS, à l’INSERM, à l’Université Paris XI et à l’Ecole Pratiques des Hautes Etudes.   L’unité de Génomique Fonctionnelle (UGF) est un service commun, dont le but est de répondre aux demandes des unités et équipes de l’IFR 54. Le développement de leurs programmes s’appuie sur les compétences de l’UGF sur un plan méthodologique et interprétation des résultats.  La méthodologie de la plate-forme repose sur la technologie microarray (Agilent Technologies) et sur la technologie PCR quantitative en temps réel (Applied Biosystems). L'ensemble de la capacité technologique et informatique est régi selon un mode de fonctionnement réglementé (respect des normes de sécurité, accès réglementés aux personnes habilitées).    1.3.         Généralités sur la technologie microarray  La technologie microarray  permet de mesurer simultanément et quantitativement
l’expression relative de plusieurs milliers de gènes. Depuis la première description en 1995 [14] , celle-ci est devenue un outil majeur, en particulier pour l’étude des tumeurs humaines.  Le principe repose sur la propriété d’hybridation spécifique de deux séquences complémentaires d’acides nucléiques. Ce sont les travaux de EM Southern [15] , décrivant en 1975 la première technique de détection des ADN par hybridation sur un support solide, appelée Southern-blot , qui aboutiront à la conception des microarrays . Cette technique a été adaptée pour l’étude des ARNm ( Northern-Blot ); les ARNm sont d’abord immobilisés sur une membrane de nitrocellulose et un oligonucléotide marqué (radioactivité ou fluorescence) spécifique du gène à étudier est hybridé sur la membrane.  Dans le cas des microarrays , il s’agit d’un Northern-Blot  inversé ; plusieurs milliers de séquences d’ADN complémentaire ( ADNc) ou oligonucléotides de synthèse sont immobilisés sur une surface solide. Chaque emplacement de séquence est soigneusement annoté (la position xi; yi correspond au gène i). Par la suite, les ARNm à étudier préalablement marqués sont hybridés sur le support solide. L'intensité du signal au niveau d'une séquence donnée sera proportionnelle au niveau d'expression de l'ARNm dans l'échantillon testé. Dans la littérature, la terminologie varie et le terme « sonde » désigne soit les séquences immobilisées sur le support solide, soit les ARNm marqués.  Dans ce mémoire, le terme « sonde » ou « spot » désignera la séquence immobilisée sur le support solide et celui de « cible » les ARNm marqués dans l'échantillon testé.     
1.4.         Les différentes technologies microarray  Ces méthodes reposent sur plusieurs centaines voire milliers d'hybridations simultanées sur un support de taille réduite (quelques cm 2 ), utilisant de l’ARN comme substrat. A partir d’un principe de base commun, certains microarrays  se distinguent en fonction de la nature du support (nylon ou verre), du système de détection (radioactivité, colorimétrie, fluorescence), du type de séquence utilisé comme sonde (ADNc ou oligonucléotides), ou bien encore sur le type d’hybridation (compétitive ou non compétitive)  1.4.1.             Le support  La majorité des support utilisés à l'heure actuelle sont réalisés sur des lames de verre
d’un format allant de 1 à 10 cm 2  (selon le fabriquant). Ce support permet une approche miniaturisée et avec de très hautes densités (plusieurs dizaines de milliers de spots par cm 2 ). Il est aussi adapté pour de faibles quantités d’ARN. Les filtres en nylon sont moins coûteux et moins utilisés, ils peuvent être réutilisés et auraient une plus grande sensibilité. Cependant la densité des spots est limitée, généralement moins d’une dizaine de milliers de spots.  1.4.2.             Le système de détection  La fluorescence est la technique la plus répandue. Elle permet une bonne sensibilité de détection du signal tout en étant facile et non contraignante à manipuler contrairement à la radioactivité. Deux types d’approches sont envisagés en fonction de l’utilisation d’un ou deux marqueurs. L’approche à un seul marqueur dite « simple marquage » ou encore « non compétitive », utilise deux échantillons qui sont marqués avec le même fluorochrome, exemple phycoérythrine pour la technologie Affymetrix. Chacun des échantillons est hybridé sur une puce séparément. L’intensité du signal sera proportionnelle à l’expression du gène correspondant.   Ce signal est généralement normalisé, par rapport au bruit de fond estimé de la puce, à un étalon interne ou bien encore par rapport à des gènes de référence. L’approche à deux marqueurs, dite « double marquage » repose sur une hybridation compétitive, deux échantillons sont marqués chacun avec un fluorochrome différent, par exemple cyanine 3-CTP (Cy3) et cyanine 5-CTP (Cy5) (Agilent Technologies et la plupart des fournisseurs). Les deux échantillons sont mélangés en proportions équivalentes. Lors de l’hybridation sur la puce il y a compétition pour l’appariement à la sonde immobilisée sur le support solide. De cette manière on mesure directement un ratio entre le signal fluorescent émis par l’échantillon marqué en Cy5 et celui de l’échantillon marqué en Cy3.   1.4.3.             Le type de séquences sur les spots  Les premières générations de puces à ADN utilisaient des ADNc de quelques centaines de bases, immobilisés sur les supports par des liaisons chimiques covalentes. Ces fragments d'ADNc issus de banques de clonage ne correspondent pas obligatoirement à des gènes identifiés. L'utilisation de banques nécessite un stockage soigneux des clones et des produits d'amplification utilisés ainsi qu’un contrôle minutieux des séquences parfois fastidieux à faire au laboratoire.
  Les puces dites à « oligonucléotides » se développent de plus en plus. Les sondes sont des oligonucléotides de synthèse allant de 25 à 80 bases. Les séquences choisies sont optimales pour hybrider chaque gène-cible (intensité, sensibilité et spécificité). Par contre ce type de sonde permet uniquement la détection de gènes connus séquencés, ce qui a priori ne pose plus de problème pour les génomes humain et murin, qui ont été totalement séquencés.     1.4.4.             La fabrication des puces  Les sondes sont généralement produites par micro déposition, ou in situ aboutissant à l’élaboration de sondes d’oligonucléotides, directement sur la surface de la puce. Deux grands types de synthèse sont utilisées : la photolithographie [10]  ou l’impression [8] . La photolithographie se fait par dépôt de couches successives des quatre bases de l'ADN sur un support en verre grâce à un système de masque. La surface de la puce est modifiée par la fixation de groupements chimiques photolabiles pouvant être activés par la lumière. Une fois illuminés, ces groupes sont susceptibles de réagir avec l’extrémité 3’ d’un nucléotide. En protégeant cette surface par des masques de formes définies on peut illuminer et donc activer sélectivement des zones de la puce où l’on souhaite fixer l’un ou l’autre des quatre nucléotides. L’utilisation successive de masques différents permet d’alterner des cycles de protection/réaction et en conséquence de « faire pousser » les sondes d’oligonucléotides sur des spots d’environ 24 µm 2 . Cette résolution permet de créer jusqu’à 250 000 spots sur une surface de 6,64 cm 2 . L’impression repose sur la propulsion de très petites sphères de fluide contenant les nucléotides, d’un volume inférieur au nanolitre se réalisant à un rythme pouvant atteindre 4 000 micro-gouttes à la seconde. Grâce à ce procédé développé par Hewlet-Packard, une tête d’impression contenant quatre « cartouches » de nucléotides A, T, C, G, ce déplace dans une matrice en deux dimensions et dépose pour chaque spot une micro-goutte correspondant à la séquence des oligonucléotides. Le processus de synthèse in situ comporte ainsi une étape de dépôt du nucléotide sur la lame pour chacun des 44 000 spots et d’un lavage entre chaque dépôt. Ce processus est répété 60 fois pour la technologies Agilent Technologies.  
1.5.         Présentation de la technologie microarra  y utilisée au sein de l’UGF  
Le choix technologique de cette plate-forme a été dans un premier temps l’utilisation de puces à oligonucléotides de 22 000 sondes (22 K) et plus récemment des puces à oligonucléotides de 44 000 sondes (44 K), commercialisée par Agilent Technologies. Elles représentent une vue compilée du génome humain. Ces sondes reposent sur la technologie de synthèse in situ  d’oligonucléotides de 60-mers sur une lame de verre qui vont servir à capter des cibles marquées d’ARN complémentaires anti-sens (ARNc). Nous rappelons que cette technologie est de type « double marquage » effectuant une mesure simultanée d’un échantillon marqué en Cy5 et d’un échantillon référence marqué en Cy3. Les cibles sont synthétisées par amplification linéaire. On synthétise de l’ADNc par transcription inverse en utilisant comme amorce un oligonucléotide de type oligo-dT qui possède à son extrémité 5’ le site pour l’enzyme T7 RNA polymerase. Grâce à cette enzyme on synthétise de l’ARNc et on le marque en même temps en incorporant des CTP couplés à des Cy3 ou des Cy5. Les ARNc marqués sont fragmentés dans un tampon spécifique. On obtient des fragments d’une longueur de 60 à 100 nucléotides permettant une hybridation optimale avec les sondes de 60-mers. L’hybridation s'accomplit dans une chambre d’hybridation fermée hermétiquement et placée dans un four. Une fois le lavage des lames effectué les lames sont séchées au pistolet à air comprimé et lues au scanner.  Ces puces à oligonucléotides de 60-mers apportent quatre avantages :   Elles permettent l’homogénéité de la température de fusion (Tm) par des valeurs de Tm peu variables de chaque oligonucléotide sur la lame.   Elles augmentent la spécificité et éliminent le bruit de fond lié à l’homologie des séquences entre gènes appartenant à une même famille.   Elles permettent de discriminer les variants issus de l’épissage alternatif.   Elles permettent de réduire sensiblement la quantité de matériel biologique (de 200 ng jusqu’à 1 µg d’ARN total par expérience).
  
2.    Problématique    L’enjeu majeur dans la réalisation d’un projet de puces microarrays  est de pouvoir
garantir la fiabilité du processus, tout en augmentant les performances et en assurant la sécurité analytique de l’ensemble. Le choix du protocole expérimental de l’étude représente une étape clé. Il consiste à bien identifier les questions posées et à définir la puissance statistique de l’étude, en l’occurrence s’assurer que le nombre et le type d’échantillons définis permettent de répondre aux questions posées. En effet il y a une multitude de types de projets possibles demandant pour chacun une étude appropriée et adaptée. Le choix d'un échantillon de référence fait également parti du design  expérimental. Plusieurs choix sont possibles, il doit toujours être établi en fonction de la question posée. Les microarrays  sont encore assez peu sensibles et par conséquent nécessitent une quantité importante d’acides nucléiques. Ce qui peut être un obstacle en terme d’applications cliniques, car les pièces opératoires ou biopsies sont le plus souvent de tailles réduites (une fois qu’un prélèvement est réalisé pour les études histologiques). L’amélioration des protocoles pour une réduction de la quantité de matériel biologique, ainsi que l’acquisition de techniques d’amplification linéaire fiable et reproductible semblent être des éléments majeurs pour de futures applications cliniques. De plus une optimisation est nécessaire lors de l’incorporation des cyanines. En effet l’efficacité d’incorporation varie en fonction des fluorophores utilisés. Ce qui induit des différences sur la quantité de produit marqué et à fortiori des variations sur les résultats d’hybridation.       
3.    Mise en place d’indicateurs de qualité
3.1.         Définition des indicateurs de qualité  Plusieurs indicateurs de qualité (IC) sont mis en place tout au long de la production de lames microarray  ; de la prise en charge du matériel biologique, jusqu’à l’analyse des résultats. Chaque étape est « verrouillée » par un indicateur. Le passage à l’étape suivante est réalisable à la seule condition que l’indicateur soit validé. Une fois les indicateurs de qualité définis, il est apparu nécessaire d’établir les spécifications techniques acceptables pour chacun des indicateurs. Ceci a permis d’intégrer un concept d’assurance qualité dans la production réelle de la plate-forme et a permis pour la première fois de pouvoir suivre les performances du processus de production en temps réel et non à posteriori.