These presentee pour obtenir le grade de Docteur de l Universite Louis Pasteur
238 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

These presentee pour obtenir le grade de Docteur de l'Universite Louis Pasteur

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
238 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Niveau: Supérieur, Doctorat, Bac+8
These presentee pour obtenir le grade de Docteur de l'Universite Louis Pasteur Strasbourg I Discipline : Sciences Medicales Recherche Clinique, Innovation Technologique, Sante Publique par Nicolas MEYER Methodes statistiques d'analyse des donnees d'allelotypage en presence d'homozygotes Soutenue publiquement le : 22 juin 2007 Membres du jury Directeur de these : M. Pierre MEYER, Professeur, ULP Strasbourg Rapporteur Interne : M. Daniel GRUCKER, Professeur, ULP Strasbourg Rapporteur Externe : Mme Catherine QUANTIN, Professeur, UB Dijon Rapporteur Externe : M. Franc¸ois KOHLER, Professeur, UHP Nancy Examinateur : M. Pierre OUDET, Professeur, ULP Strasbourg

  • methodes statistiques d'analyse des donnees d'allelotypage en presence d'homozygotes

  • critiques de la theorie du test d'hypothese

  • partial least

  • donnees d'allelotypage

  • choix du cadre statistique

  • cadre general de la theorie bayesienne

  • colon cancer


Sujets

Informations

Publié par
Publié le 01 juin 2007
Nombre de lectures 92
Langue Français

Extrait

Th?ese pr¶esent¶ee pour obtenir le grade de
Docteur de l’Universit¶e Louis Pasteur
Strasbourg I
Discipline : Sciences M¶edicales
Recherche Clinique, Innovation Technologique, Sant¶e Publique
par NicolasMEYER
M¶ethodes statistiques d’analyse des donn¶ees
d’all¶elotypage en pr¶esence d’homozygotes
Soutenue publiquement le : 22 juin 2007
Membres du jury
Directeur de thes? e : M. Pierre MEYER, Professeur, ULP Strasbourg
Rapporteur Interne : M. Daniel GRUCKER, Professeur, ULP Strasbourg
Rapporteur Externe : Mme Catherine QUANTIN, Professeur, UB Dijon
Rapporteur Externe : M. Fran»cois KOHLER, Professeur, UHP Nancy
Examinateur : M. Pierre OUDET, Professeur, ULP StrasbourgRemerciements
A Monsieur le Pr. Meyer, pour m’avoir aid¶e a? creuser mon sillon...
A Madame le Pr. Quantin, pour votre bienveillance a? mon ¶egard,
A Monsieur le Pr. Kohler, pour votre jugement, riche d’enseignement,
A Monsieur le Pr. Oudet, pour la conflance que vous m’avez toujours t¶emoign¶e,
A Monsieur le Pr. Grucker, pour l’honneur que vous me faite de juger mon travail,
... et a? Marie Pierre Gaub, pour ton aide tres? pr¶ecieuse. Sans toi, je n’aurais pas pu mener
a? bien ce travail!
| | |
A mon ¶epouse et mes fllles, pour leur inflnie patience,
A ma famille.
| | |
(En r¶ealit¶e, nous ne savons rien, car la v¶erit¶e est au fond de l’abime.)
D¶emocriteR¶esum¶e Les donn¶ees d’all¶elotypage contiennent des mesures r¶ealis¶ees par Polymerase
Chain Reaction surunes¶eriedemicrosatellitesdel’ADNaflnded¶eterminerl’existenced’un
d¶es¶equilibre all¶elique pour ces microsatellites. D’un point de vue statistique, ces donn¶ees
sont caract¶eris¶ees par un nombre important de donn¶ees manquantes (en cas d’homozygotie
du microsatellite), par des matrices carr¶ees ou comportant plus de variables que de sujets,
des variables biniomiales, des efiectifs parfois faibles et ¶eventuellement de la colin¶earit¶e.
Les m¶ethodes statistiques fr¶equentistes ont un nombre important de limites qui font choisir
un cadre bay¶esien pour analyser ces donn¶ees. En analyse univari¶ee, l’int¶er^et du facteur
de Bayes est explor¶e et difi¶erentes variantes selon l’absence ou la pr¶esence de donn¶ees
manquantes sont compar¶ees. Difi¶erents types d’imputations multiples sont ensuite ¶etudi¶es.
Des mode?les de type m¶eta-analyses sont ¶egalement ¶evalu¶es. En analyse multivari¶ee, un
model?edetypePartialLeastSquare estd¶evelopp¶e.Lemodel?eestappliqu¶esousuneformede
model?e lin¶eaire g¶en¶eralis¶e (r¶egressionlogistique)et combin¶eavecl’algorithme Non Iterative
Partial Least Squares, ce qui permet de g¶erer simultan¶ement toutes les limites propres aux
donn¶ees d’all¶elotypage. Les propri¶et¶es de ce mod?ele sont explor¶ees. Il est ensuite appliqu¶e
a? des donn¶ees d’all¶elotypage portant sur 33 microsatellites de 104 patients porteurs d’un
cancer du colon pour pr¶edire le stade Astler-Coller de la tumeur. Un model?e avec toutes les
interactions possibles entre couples de microsatellites est ¶egalement r¶ealis¶e.
Title Considering homozygotes in Statistical analysis of allelotyping data.
Summary AllelotypingdatacontainmeasuresdoneusingPolymeraseChainReactionon
a batch of DNA microsatellites in order to ascertain the presence or not of an allelic
imbalance for this microsatellites. From a statistical point of view, those data are characterised
by a high number of missing data (in case of homozygous microsatellite), square or at
matrices, binomial data, sample sizes which may be small with respect to the number of
variables and possibly some colinearity. Frequentist statistical methods have a number of
shortcomings who led us to choose a bayesian framework to analyse these data. For
univariate analyses, the Bayes factor is explored and several variants according to the presence
or absence of missing data are compared. Difierent multiple imputations types are then
studied. Meta-analysis models are also assessed. For multivariate analyses, a Partial Least
Square model is developed. The model is applied under a generalised linear model
(logistic regression) and combined with a Non Iterative Partial Least Squares algorithm which
3makes it possible to manage simultaneously all the limits of allelotyping data. Properties
of this model are explored. It is then applied on allelotyping data on 33 microsatellites of
104 patients who have colon cancer to predict the tumor Astler-Coller stage. A model with
all possible microsatellites pairs interactions is also run.
Mots-cl¶es : Polymerase Chain Reaction, Partial Least Squares, bayes, all¶elotypage,
microsatellites,
Key-words : Polymerase Chain Reaction, Partial Least Squares, bayes, allelotyping,
microsatellites,
Adresse : Laboratoire de Biostatistique
Facult¶e de M¶edecine
4, rue Kirschleger
67089 STRASBOURG
4Table des matiere? s
1 Introduction 9
1.1 D¶eflnition des microsatellites . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Utilisation des microsatellites en canc¶erologie. . . . . . . . . . . . . . . . . . 12
1.3 Aspects g¶en¶eraux des donn¶ees a? ¶etudier . . . . . . . . . . . . . . . . . . . . . 16
1.4 R¶esum¶e sur le probl?eme pos¶e et les objectifs du model?e . . . . . . . . . . . . 20
1.5 Organisation du document . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 Choix du cadre statistique 22
2.1 Le test d’hypoth?ese : concepts de base . . . . . . . . . . . . . . . . . . . . . 22
2.1.1 La position de Neyman-Pearson . . . . . . . . . . . . . . . . . . . . . 22
2.1.2 La position Fisherienne . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.1.3 Oppositions entre les deux approches . . . . . . . . . . . . . . . . . . 25
2.2 Les critiques de la th¶eorie du test d’hypothe?se . . . . . . . . . . . . . . . . . 26
2.3 Les erreurs d’interpr¶etation . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Les arguments en faveur du test d’hypoth?ese nulle . . . . . . . . . . . . . . . 30
2.5 Les solutions possibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6 La th¶eorie bay¶esienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6.1 Cadre g¶en¶eral de la th¶eorie bay¶esienne . . . . . . . . . . . . . . . . . 31
2.6.2 Le th¶eorem? e de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7 Int¶er^et de la statistique bay¶esienne dans le domaine biom¶edical . . . . . . . . 34
2.7.1 L’absence d’hypothese? nulle . . . . . . . . . . . . . . . . . . . . . . . 34
2.7.2 L’absence de seuil fi . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.7.3 L’absence de p-valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.7.4 Les tests multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.7.5 La quantiflcation directe de l’efiet du traitement . . . . . . . . . . . . 36
2.7.6 La confrontation des hypotheses? n’en ¶elimine aucune . . . . . . . . . 37
2.7.7 L’utilisation de connaissances ant¶erieures . . . . . . . . . . . . . . . . 37
2.7.8 Le respect du principe de vraisemblance . . . . . . . . . . . . . . . . 39
2.7.9 Conclusion interm¶ediaire sur les m¶ethodes bay¶esiennes . . . . . . . . 39
3 L’analyse d’une table de contingence 39
3.1 Forme g¶en¶erale de la table de contingence . . . . . . . . . . . . . . . . . . . 40
53.2 Les paramet? res d’int¶er^ets dans une table de contingence . . . . . . . . . . . . 42
3.2.1 La diަerence de risque . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.2 Le risque relatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.3 L’odds-ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3 Analyse fr¶equentiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4 Analyse bay¶esienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5 Cas des donn¶ees binomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.1 Rappel sur la loi Beta . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.6 Rappel sur la loi de Dirichlet. . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.6.1 Choix de la loi a priori et de ces paramet? res . . . . . . . . . . . . . . 48
3.7 Le choix du mode?le d’¶echantillonnage . . . . . . . . . . . . . . . . . . . . . . 49
3.8 Le calcul du facteur de Bayes dans un tableau 2£2 . . . . . . . . . . . . . . 50
4 Analyses statistiques pour donn¶ees incomplet? es 53
4.1 D¶eflnitions g¶en¶erales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2 M¶ecanisme des manquants . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2.1 M¶ecanisme mat¶eriel menant aux donn¶ees manquantes . . . . . . . . . 55
4.2.2 M¶ecanisme statistique menant aux donn¶ees manquantes. . . . . . . . 55
4.3 N¶ecessit¶e d’analyse pour donn¶ees manquantes . . . . . . . . . . . .

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents