Année Universitaire

Publié par

Niveau: Supérieur
Année Universitaire 2010 - 2011 Faculté de Médecine Montpellier-Nîmes(M.e.l. 18/10/10– LIPCOM)P. Dujols MB6 – Bio-statistiques - Statistiques inférentielles : variables quantitatives analyse univariée 1 Statistiques inférentielles Variables Quantitatives analyse univariée 2 Plan du cours ÂRappels Î3 problématiques ÎStatuer sous incertitude: les 8 étapes ÎStatuer sous incertitude: risques et décision ÎMoyenne et estimation ÂComparaison (tests paramétriques) ÎMoyenne Théorique _ Moyenne Observée Î2 Moyennes Observées ?échantillons indépendants ?échantillons appariés ÂEléments sur les tests non paramétriques 3 rappels 4 Rappels : statuer sous incertitude 3 situations ? population échantillontirage au sort Pour une variable X : on connaît les paramètres dans la population à quoi peut-on s'attendre dans un échantillon ? ? population échantillontirage au sort Pour une variable X : on a calculé les paramètres dans un échantillon à quoi peut-on s'attendre dans la population ? Pour une variable X : on a calculé les paramètres dans 2 échantillons peut-on conclure à un effet de la cause dans la population ? population échantillon 1tirage au sort échantillon 2tirage au sort CAUSE + effet ? -

  • test îchoix du test îvérification

  • îbiais de sélection îbiais de classement îbiais de confusion

  • conclusions statistiques

  • rejet de h0

  • m1 ≠

  • bio-statistiques - statistiques inférentielles


Publié le : mardi 29 mai 2012
Lecture(s) : 39
Source : med.univ-montp1.fr
Nombre de pages : 8
Voir plus Voir moins
MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée
P. Dujols
Statistiques inférentielles
Variables Quantitatives
analyse univariée
rappels
1
3
(M.e.l. 18/10/10– LIPCOM)
Année Universitaire 2010  2011
Plan du cours
ÂRappels Î3 problématiques ÎStatuer sous incertitude: les 8 étapes ÎStatuer sous incertitude: risques et décision ÎMoyenne et estimation ÂComparaison (tests paramétriques) ÎMoyenne Théorique # Moyenne Observée Î2 Moyennes Observées ¾échantillons indépendants ¾échantillons appariés ÂEléments sur les tests non paramétriques
Rappels : statuer sous incertitude
3 situations ? tirage au sort populationéchantillon Pour une variable X : on connaît les paramètres dans la population à quoi peuton s’attendre dans un échantillon ? ? populationéchantillon tirage au sort Pour une variable X : on a calculé les paramètres dans un échantillon à quoi peuton s’attendre dans la population ?
2
échantill tirage au sorton 1+ CAUSE populationeffet? -tirage au sortéchantillon 2 Pour une variable X : on a calculé les param res ans 2 échantillons peuton conclure à un effet de la cause dans la population ? 4
Faculté de Médecine MontpellierNîmes
MB6– BiostatistiquesStatistiques inférentielles
P. Dujols
: variables quantitatives analyse univariée
Rappels : les 8 étapes des tests (a)
1.Énoncé de la problématique Îquestion Îtype de problème statistique (population, échantillons, type de variable) Îchoix du seuil de signification = risqueα(en général 5%) 2.Hypothèses Îtoujours formulées en termes de populationcar ¾fluctuations d’échantillonnage ¾on veut conclure sur la (les) population(s) dont est/sont extrait(s) le(s) échantillon(s) observé(s) Îtoujours 2 hypothèses ¾hypothèse nulle (H0):« rien ne change, pas d’effet … » yéchantillon(s) extrait(s) au hasard de la même population yen général = inverse de ce que l’on cherche à montrer ¾hypothèse alternative (H1) yéchantillon(s) non extrait(s) au hasard de la même population 3.H0 est supposée vraie
Risques et règles de décision
Âavant la décision … ÎSupposition H0 vraie ÎTest effectué donnant ¾p :(pvalue): degré de signification ¾= probabilité d’avoir une différence au moins égale à celle observée ÂRègle de décision ÎSip≤ α: H0 peu probablerejet de H0 au risque p ÎSip >α: H0 probablenon rejet de H0 au risque p
H0 vraie
non rejet de H0
seuilα
p
écart-réduit rejet de H0
5
7
(M.e.l. 18/10/10– LIPCOM)
4.Test ÎChoix du test Îvérification conditions ¾nombre de sujets ¾normalité de distribution des variables Îréalisation (calculs) 5.Lecture dans la table et déduction du p 6.Conclusion statistique Îp >α: non rejet de H0 Îp≤ α: rejet de H0 au risque p 7.Évaluation des biais éventuels Îbiais de sélection Îbiais de classementcf cours biais en LCA Îbiais de confusion 8.Conclusion clinique
réalité
H est vraie 0 H est vraie 1
Année Universitaire 2010  2011
étapes des tests (b)
Risques et règles de décision
décision rejet de H non rejet de H 0 0 1α risqueα 1β(puissance) risqueβ
Ârisqueα ère ÎSeuil de significationouespècerisque de 1 ouerreur de type 1 ÎSeuil de probabilité de rejeter H0 alors que H0 est vraie Îexemple: risque de considérer un produit actif alors qu’il est inactif ÎFixé a priori avant le test ¾en général 5%(mais < 5% dans les essais thérapeutiques si nouveau produit toxique) Ârisqueβ Îrisque de 2ème espèceouerreur de type II ÎSeuil de probabilité de ne pas rejeter H0 alors que H1 est vraie Îexemple: risque de considérer un produit inactif alors qu’il est actif ÎFixé a priori avant le test ¾en général < 20%(parfois > 20% si comparaison de 2 produits à toxicité et coût similaires)
6
8
Faculté de Médecine MontpellierNîmes
non rejet de H 0 (différence non statistiquement significative)
Moyenne et estimation (b)
9
2 (xm) i N1
La différence est peut être suffisamment faible (1α)
C’est peut être par manque de puissance (β)
Comparaison de 2 traitements
10
ÉchantillonΣxi m = NN m= moyenne observée (âge moyen)≠ μmais voisine mmmm1 2 3 4 recommencé K fois tous voisins et≠ μ m
Variable X: âge
Moyenne observée
c’est peut être vrai (1β)
c’est peut être faux (α)
s N
ÂL’écartréduit
11
ÂPropriétés de lamoyenne observée m ÎVariable aléatoire ¾Moyenne théorique E(m) =μ ¾Variance théorique Var(m)=σ/N 2 ÎLoi de distribution de mdépend de la loi de X et de l’effectif N
Loi de X Unimodale, ?
effectif N
<30
<30
LN (μ, σ/N )
Student à N1 ddl LN (0,1)
12
MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée
Student à N1 ddl LN (0,1)
?
30
30
effectif N
LN (μ,σ)
m
ε
=
suit
Âmais … souventσinconnu Îσremplacé par écarttype de l’échantillons= (approximation)
Student à N1 ddl
rejet de H 0 (différence statistiquement significative)
Degré de signification et conclusion statistique
Loi de X LN (μ,σ) Unimodale, ? LN (μ, )LN (μ, ) σ/Nσ/N
?
P. Dujols
moyenne théoriqueμ écart-type théoriqueσ
différence cliniquement intéressante ou non cliniquement intéressante
Faculté de Médecine MontpellierNîmes
(M.e.l. 18/10/10– LIPCOM)
Moyenne et estimation (a)
Année Universitaire 2010  2011
Moyenne et estimation (c)
population
Tirage de N individusau hasard
MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée
P. Dujols
Variables quantitatives comparaison univariée
Comparaison Moyenne observée # Moyenne théorique
Î=>4. Test: N > 30 εsuit LN(0,1) Î5. On lit dans table LN (0,1) ¾proba (| écart réduit |ε)< 0,001
α0,02 0,03 0,04 0,05 0,060,00 0,01 0,00 +2,5761,8812,054 1,96 2,326 2,170 0,10 1,645 1,598 1,555 1,514 1,476 1,440 1,405 0,20 1,282 1,254 1,227 1,200 1,175 1,150 1,126 Table de la loi normale centré réduite Î6. Conclusion statistique ¾rejet de H0 ¾différence hautement significative Î7. biais non évaluables Î8. Conclusion clinique: échantillon présente une glycémie anormalement élevée
13
15
(M.e.l. 18/10/10– LIPCOM)
Année Universitaire 2010  2011
Comparaison Moyenne observée # Moyenne théorique
ÂProblème: exemple 1 ÎÉchantillon : 100 obèses ÎCritère de jugement : glycémie m=1,4g/l ; s=0,8g/l ÎQuestion : ont – ils une glycémie anormale (μ= 1g/l) ? ÂRaisonnement Ζ m1. Problématique: comparaison m th obs Î2. Hypothèses ¾H0: population d’où provient l’échantillon aμ= 1g/l ¾H1: population d’où provient l’échantillon aμ ≠1g/l Î3. Sous H0, calcul deε m ε= s ε=(1,41) /0,8/100=4/0,8=5N
Comparaison Moyenne observée # Moyenne théorique
ÂProblème: exemple 2 ÎÉchantillon : 25 obèses ÎCritère de jugement : glycémie m=1,4g/l ; s=0,8g/l ÎQuestion : ont – ils une glycémie anormale (μ= 1g/l) ? ÂRaisonnement Î1. Problématique: comparaison m – m th obs Î2. Hypothèses ¾H0: population d’où provient l’échantillon aμ= 1g/l ¾H1: population d’où provient l’échantillon aμ ≠1g/l Î3. Sous H0, calcul deε m ε= s ε=(1,41) /0,8/25=2/0,8=2,5 N
14
16
Faculté de Médecine MontpellierNîmes
MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée
P. Dujols
Comparaison Moyenne observée # Moyenne théorique
Î4. Test: N < 30 =>εsuit Loi de Student à 24 ddl Î5. On lit dans table Student à 24 ddl ¾proba (|écart réduit|ε)< 0,02 Î6. Conclusion statistique ¾rejet de H0 ¾différence significative Î7. biais: non évaluables Î8. Conclusion clinique: échantillon présente une glycémie anormalement élevée
2 moyennes observées: échantillons indépendants «grands»
CAS où N et N tous les 2 grands (30): test de l’écart réduit 1 2 3. On suppose H0 vraie:μ1=μ2 Îm1 suit LN (μ1,s1/N1 ) Îm2 suit LN (μ2,s2/N2) 2 2 s s 1 2 ÎLN(0, )m1m2 suit + N N 1 2
4. On calcule écartréduitεqui suit LN (0,1) 5. on lit table LG(0,1)p = proba(|écart réduit|≥ ε) 6. Conclusion statistique Îp > 0,05 (ε< 1,96) on ne rejette pas H0 Îp0,05 (ε ≥1,96) on rejette H0 au risque p
17
19
(M.e.l. 18/10/10– LIPCOM)
Année Universitaire 2010  2011
Comparaison de 2 moyennes observées
ÂE1 et E2 sont «probablement égaux» Îs’ils proviennent au hasard de la même population Îsi les moyennes observées sont des « fluctuations » ÂFormulation des hypothèses ÎH0 : E1 et E2 sont extraits au hasard d’une même population (μ1= μ2) ÎH1 : E1 et E2 non extraits au hasard ouμ1μ2 Â2 CAS Îéchantillons «indépendants»: E1 (N1) et E2 (N2) ¾N1 et N2 tous les 2 grands (30) ¾N1 ou N2 petit (<30) Îéchantillons appariés: ¾N grand (30) ¾N petit (<30)
2 moyennes observées: échantillons indépendants
ÂProblème: exemple 3 Î2 groupes de 100 patients avec diabète de type2 ÎFacteur étudié: hypoglycémiant (gr1) et placebo (gr2) ÎCritères de jugement: glycémie Îs1=0,5g/l et m2=1,4g/l ; m1=1,2g/l ; s2=0,8g/l ÎQuestion: traitement hypoglycémiant efficace? 1. Problématique:2 moyennes obs, 2 échantillons indép 2.Test:Hypothèses: H0:μ1 =μ2 et H1:μ1μ2 3. SousH0, N30 =>εsuit LN(0,1), calcul deε= 2,11 4 et 5. table LN(0,1)proba (|écartréduit|≥ ε) => p < 0,04 6. Conclusion statistique: p<α=0,05 => rejet de H0; différence significative 8. Conclusion clinique:si aucun biais, ttt efficace
18
20
Faculté de Médecine MontpellierNîmes
MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée
P. Dujols
2 moyennes observées: échantillons indépendants «petits»
CAS où N ou N petit (<30) 1 2 ET X gaussienne dans la Population d’où est extrait E 1 X gaussienne dans la Population d’où est extrait E 2 2 2 les variances s et s sont égales statistiquement 1 2
mm 1 2 ε= 1 1 s+ N N 1 2
s=
Test de Student
2 2 (N1)s+(N1)s 1 2 1 2 N+N2 1 2
Âon suppose H0 vraie:μ1 =μ2 Âon calcule écartréduitεqui suit loi de Student à N1+N22 ddl Âon lit dans Student à N1+N22 ddl : p = proba(|écart réduit|ε) Îon ne rejette pas H0p > 0,05 Îp0,05 on rejette H0 au risque p
2 moy obs: 2 échantillons non indépendants «appariés»
ÂSéries appariées : Recueil d’une même variable chez le même sujet Îà des temps différents ou Îpar des observateurs différents
x 1 x 2 x N E 1
y 1 y 2 y N E 2
E et E même taille N 1 2 correspondance entre x et y i i
x - y 1 1 x - y 2 2 x - y N N échantillon des différences
21
23
(M.e.l. 18/10/10– LIPCOM)
Année Universitaire 2010  2011
2 moyennes observées: échantillons indépendants «petits»
ÂProblème: exemple 4 Î2 groupes de 25 patients avec diabète de type2 ÎFacteur étudié: hypoglycémiant (gr1) et placebo (gr2) ÎCritères de jugement: glycémie Îs2=0,8g/ls1=0,5g/l et m2=1,4g/l ; m1=1,2g/l ; ÎQuestion: traitement hypoglycémiant efficace? 1. Problématique:2 moyennes obs, 2 échantillons indép 2.Test:Hypothèses: H0:μ1 =μ2 et H1:μ1μ2 3. SousH0,variances supposées égales et glycémie suit LN Îcalcul de s2 = 0,445 puis deε= 1,06 4 et 5. table studentà 25+252 ddl => p > 0,05 6. Conclusion statistique: p >α=0,05 => non rejet de H0 différence non significative 8. Conclusion clinique:ttt non prouvé efficace 22
2 moy obs: 2 échantillons non indépendants «appariés»
ÂStratégie 2. Formulation des hypothèses ÎH0 échantillon des différences (moyenne d) est extrait au hasard d’une population où moyenneδ= 0 ÎH1 :δ ≠0 3. On calcule Îla moyenne des différences Îl’écarttype de la différence moyenne ÂOn est ramené au problème de comparaison d’un échantillon avec différence moyenne observée d à une population où différence moyenneδvaut 0
24
Faculté de Médecine MontpellierNîmes
MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée
P. Dujols
2 moy obs: 2 échantillons non indépendants «appariés»
ÂIntérêt des séries appariées: ÎLa variance de la différence (XY) pour 2 échantillons appariés est souvent plus faible (corrélation positive) que pour 2 E indépendants 2 2 2 Îσ=σ+σ– 2 cov (X,Y) (XY) X Y Âconséquences Ϋ plus de chances de rejeter H0 » ÎPour la même différence recherchée, et risques d’erreur consentis, le nombre de sujets à inclure est inférieur ÂConditions d’utilisation: Îcomparabilité des 2 échantillons appariés pour tous facteurs sauf pour facteur étudié Îessais croisés (crossover) cf cours épidémio + LCA
Tests non paramétriques appliqués aux variables quantitatives
ÂPrincipe ÎTests basés sur les rangs et non sur les valeurs ÂAvantages: ÎPas de condition d’utilisation ÎPeuvent être utilisés dans tous les problèmes ÎPlus efficaces que tests paramétriques quand conditions de validité de ces derniers non vérifiées ÂInconvénients: ÎPerte d’information par rapport aux tests paramétriques ÎSouvent moins puissants que tests paramétriques
25
27
(M.e.l. 18/10/10– LIPCOM)
Année Universitaire 2010  2011
Éléments concernant les tests non paramétriques
Tests non paramétriques appliqués aux variables quantitatives
ÂComparaison de 2 moyennes observées
CAS où N ou N petit (<30) 1 2 ET les conditions X gaussienne dans la Population d’où est extrait E 1 X gaussienne dans la Population d’où est extrait E 2 2 2 les variances s et s sont égales statistiquement 1 2 vérifiées
CAS où N ou N petit (<30) 1 2 ET les conditions X gaussienne dans la Population d’où est extrait E 1 X gaussienne dans la Population d’où est extrait E 2 2 2 les variances s et s sont égales statistiquement 1 2 NON vérifiées
Test de Student
Test non paramétrique
de Mann-Whitney Wilcoxon
26
28
Faculté de Médecine MontpellierNîmes
MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée
P. Dujols
Conclusion & récapitulatif
29
(M.e.l. 18/10/10– LIPCOM)
problématique Comparaison m àμ obs
Comparaison de 2 m indépendantes obs
Comparaison de 2 m dépendantes obs
Comparaison de k m indépendantes obs
Liaison de 2 variables quantitatives
H0 m=μ
μ1=μ2
δ=0
μ1=μ2=μ k
Indépendance ρ=0
H1 m≠ μ
μ1≠ μ2
δ ≠0
uneμest i des autres Liaison ρ0
Année Universitaire 2010  2011
récapitulatif
test εou Student (conditions) MannWhitney εou Student (conditions) MannWhitney
εou Student apparié (conditions) Wilcoxon apparié
ANOVA (conditions) KruskallWallis
ρ(conditions) Pearson ρ Spearman
30
Faculté de Médecine MontpellierNîmes
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi