Développement d une méthodologie robuste de sélection de gènes dans le cadre d une activation pharmacologique de la voie PPAR
185 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Développement d'une méthodologie robuste de sélection de gènes dans le cadre d'une activation pharmacologique de la voie PPAR

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
185 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Sous la direction de Christian Saguez
Thèse soutenue le 03 décembre 2009: Ecole centrale Paris
De part leur dimension élevée, les données de puces à ADN nécessitent l’application de méthodes statistiques pour en extraire une information pertinente. Dans le cadre de l’étude des différences entre deux agonistes de PPAR (Peroxisome Proliferator-Activated Receptor), nous avons sélectionné trois méthodes de sélection de variables : T-test, Nearest Shrunken Centroids (NSC) et Support Vector Machine – Recursive Feature Elimination. Ces méthodes ont été testées sur des données simulées et sur les données réelles de l’étude PPAR. En parallèle, une nouvelle méthodologie, MetRob, a été développée afin d’améliorer la robustesse ce ces méthodes vis à vis de la variabilité technique des puces à ADN, ainsi que leur reproductibilité. Cette nouvelle méthodologie permet principalement d’améliorer la valeur prédictive positive, c’est-à-dire la confiance accordée aux résultats. La méthode NSC s’est révélée la plus robuste et ce sont donc les résultats de cette méthode, associée à MetRob, qui ont été étudiés d’un point de vue biologique.
-Traitement de données
-Peroxisome Proliferator-Activated Receptor
The microarray technology provides high dimensional data that need to be statistically treated for extracting relevant information. Within the context of the study of the differences between two PPAR (Peroxisome Proliferator-Activated Receptor) agonists, we selected three feature selection methods : T-test, Nearest Shrunken Centroids (NSC) and Support Vector Machine – Recursive Feature Elimination. These methods were tested on simulated and on real data. At the same time, a new methodology, MetRob, was developed in order to improve the robustness of these methods towards the technical variability of microarrays, as well as their reproducibility. This new methodology mainly improves the positive predictive value, which means the confidence in the results. The NSC method was found to be the most robust. The results of the association of MetRob and NSC were thus studied from a biological point of view.
-Peroxisome Proliferator-Activated Receptor
-Microarray
-Data Mining
Source: http://www.theses.fr/2009ECAP0040/document

Sujets

Informations

Publié par
Nombre de lectures 104
Langue Français
Poids de l'ouvrage 3 Mo

Extrait

ÉCOLE CENTRALE DES ARTS
ET MANUFACTURES
« ÉCOLE CENTRALE PARIS »


THÈSE
présentée par

Aurélie COTILLARD

pour l’obtention du

GRADE DE DOCTEUR

Spécialité : Mathématiques appliquées

Laboratoire d’accueil : MAS

SUJET : Développement d’une méthodologie robuste de sélection de gènes dans
le cadre d’une activation pharmacologique de la voie PPAR




soutenue le : 03/12/09

devant un jury composé de :

M. Jean-Philippe Vert Président
M. Pascal Barbry Rapporteur
M. Avner Bar-Hen Rapporteur
M. Jean-Pierre Galizzi Examinateur
Mme Françoise Xavier Examinateur
M. Christian Saguez Directeur de thèse
M. Brian Lockhart Invité



2009ECAP0040


tel-00451969, version 1 - 1 Feb 2010 2



tel-00451969, version 1 - 1 Feb 2010 3


Résumés


Résumé en français :

De part leur dimension élevée, les données de puces à ADN nécessitent l’application de
méthodes statistiques pour en extraire une information pertinente. Dans le cadre de l’étude des
différences entre deux agonistes de PPAR (Peroxisome Proliferator-Activated Receptor), nous
avons sélectionné trois méthodes de sélection de variables : T-test, Nearest Shrunken
Centroids (NSC) et Support Vector Machine – Recursive Feature Elimination. Ces méthodes
ont été testées sur des données simulées et sur les données réelles de l’étude PPAR. En
parallèle, une nouvelle méthodologie, MetRob, a été développée afin d’améliorer la
robustesse ce ces méthodes vis à vis de la variabilité technique des puces à ADN, ainsi que
leur reproductibilité. Cette nouvelle méthodologie permet principalement d’améliorer la
valeur prédictive positive, c’est-à-dire la confiance accordée aux résultats. La méthode NSC
s’est révélée la plus robuste et ce sont donc les résultats de cette méthode, associée à MetRob,
qui ont été étudiés d’un point de vue biologique.

Mots clés : Puces à ADN, Sélection de variables, Traitement de données, PPAR, Diabète de
type 2


Résumé en anglais :

The microarray technology provides high dimensional data that need to be statistically treated
for extracting relevant information. Within the context of the study of the differences between
two PPAR (Peroxisome Proliferator-Activated Receptor) agonists, we selected three feature
selection methods : T-test, Nearest Shrunken Centroids (NSC) and Support Vector Machine –
Recursive Feature Elimination. These methods were tested on simulated and on real data. At
the same time, a new methodology, MetRob, was developed in order to improve the
robustness of these methods towards the technical variability of microarrays, as well as their
reproducibility. This new methodology mainly improves the positive predictive value, which
means the confidence in the results. The NSC method was found to be the most robust. The
results of the association of MetRob and NSC were thus studied from a biological point of
view.

Key words : Microarray, Feature selection, Data Mining, PPAR, Type 2 Diabetes


tel-00451969, version 1 - 1 Feb 2010 4

tel-00451969, version 1 - 1 Feb 2010 5
Remerciements



Je tiens à exprimer tout d’abord mes remerciements aux membres du jury, qui ont accepté
d’évaluer mon travail de thèse.


Merci à M. Jean-Philippe Vert, Directeur du Centre for Computational Biology de Mines
ParisTech, d’avoir accepté de présider le jury de cette thèse, et à MM. Pascal Barbry,
directeur de l’IPMC, Sofia Antipolis, et Avner Bar-Hen, professeur à l’Université Paris
Descartes, d’avoir accepté d’être les rapporteurs de ce manuscrit. Leurs remarques et
suggestions lors de la lecture de mon rapport m’ont permis d’apporter des améliorations à la
qualité de ce dernier.


Merci à Christian Saguez, pour avoir accepté de diriger cette thèse et pour la confiance et la
liberté qu’il m’a accordées.


Je tiens à remercier aussi Françoise Xavier, dont le soutien et la présence constante, m’ont
permis de mener ce travail à terme.


Merci également à Jean-Pierre Galizzi pour son implication dans ce travail, sa disponibilité et
ses précieux conseils.


A Brian Lockhart, directeur de la division PPM à l’Institut de Recherches Servier, merci de
m’avoir accueilli au sein de son équipe.


Je tiens à remercier l’ensemble de la division PPM de l’Institut de Recherches Servier et plus
particulièrement Sophie G., Nolwen, Chantal, Sabrina et Sophie M. pour leurs conseils et leur
accueil, ainsi que les membres de la division P03 qui ont réalisé les expériences sur les souris.


Un grand merci également à Sylvie et Corinne pour leur gentillesse et leur efficacité lors des
difficultés administratives ou logistiques que j’ai rencontrées.



tel-00451969, version 1 - 1 Feb 2010 6
Je tiens enfin à remercier les amis, thésards ou non, qui m’ont aidé au cours des trois ans de
cette thèse. Merci à mes cobureaux successifs, Marc, Takuya, Cédric et Véro, ainsi qu’aux
équipes Masbio et Digiplante pour les discussions enrichissantes (professionnelles ou non…)
et les sympathiques soirées pizza-jeux : Vincent, Qi Rui, Marlène, Xiu Juan, Qiongli, Zhong
Ping, Benoît, Thomas, Fenni, Natacha, Guanghui, Frédérique, ... Merci également à mes amis
de longue date qui ont supporté mes moments de doute : Elodie, Murielle, Maud et toutes les
petites familles associées… Et merci à Mahendra pour m’avoir accompagnée pendant la
dernière partie, la plus stressante (ah le résumé de rapport au téléphone…), de cette thèse.


Finalement j’adresse un grand merci à toute ma famille qui a toujours été présente lorsque
j’en ai eu besoin, en particulier à mon frère, à mon père et à ma mère.






tel-00451969, version 1 - 1 Feb 2010 7


Table des matières



Résumés..................................................................................................................................... 3
Remerciements ......................................................................................................................... 5
Table des matières.................................................................................................................... 7
Table des figures..................................................................................................................... 11
Liste des tableaux ................................................................................................................... 15
Liste des abréviations............................................................................................................. 17
Préambule ............................................................................................................................... 19
Chapitre 1 : Contexte biologique et technologique ............................................................ 21
1.1 Diabète ....................................................................................................................................... 21
1.1.1 Métabolisme d’un individu non diabétique.................................................................................... 21
1.1.2 Diabète de type 1............................................................................................................................... 23
1.1.3 Diabète de type 2............................................................................................................................... 23
1.2 Modèles animaux du diabète de type 2 ................................................................................... 24
1.3 Peroxisome Proliferator-Activated Receptors........................................................................ 26
1.3.1 PPAR, un récepteur nucléaire impliqué dans le métabolisme...................................................... 26
1.3.2 Des agonistes PPAR contre le diabète de type 2............................................................................. 27
1.4 Puces à ADN .............................................................................................................................. 28
1.4.1 Principe des puces à ADN .............................................................................................

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents