8 pages

Français

Année Universitaire

profil-nechor-2012

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

8 pages

Français

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

A propos
Informations
Extrait

Description

Niveau: Supérieur
Année Universitaire 2010 - 2011 Faculté de Médecine Montpellier-Nîmes(M.e.l. 18/10/10– LIPCOM)P. Dujols MB6 – Bio-statistiques - Statistiques inférentielles : variables quantitatives analyse univariée 1 Statistiques inférentielles Variables Quantitatives analyse univariée 2 Plan du cours ÂRappels Î3 problématiques ÎStatuer sous incertitude: les 8 étapes ÎStatuer sous incertitude: risques et décision ÎMoyenne et estimation ÂComparaison (tests paramétriques) ÎMoyenne Théorique _ Moyenne Observée Î2 Moyennes Observées ?échantillons indépendants ?échantillons appariés ÂEléments sur les tests non paramétriques 3 rappels 4 Rappels : statuer sous incertitude 3 situations ? population échantillontirage au sort Pour une variable X : on connaît les paramètres dans la population à quoi peut-on s'attendre dans un échantillon ? ? population échantillontirage au sort Pour une variable X : on a calculé les paramètres dans un échantillon à quoi peut-on s'attendre dans la population ? Pour une variable X : on a calculé les paramètres dans 2 échantillons peut-on conclure à un effet de la cause dans la population ? population échantillon 1tirage au sort échantillon 2tirage au sort CAUSE + effet ? -

test îchoix du test îvérification

îbiais de sélection îbiais de classement îbiais de confusion

conclusions statistiques

rejet de h0

m1 ≠

bio-statistiques - statistiques inférentielles

Informations

Publié par	profil-nechor-2012
Nombre de lectures	39
Langue	Français

Extrait

MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée

P. Dujols

Statistiques inférentielles

Variables Quantitatives

analyse univariée

rappels

(M.e.l. 18/10/10– LIPCOM)

Année Universitaire 2010  2011

Plan du cours

ÂRappels Î3 problématiques ÎStatuer sous incertitude: les 8 étapes ÎStatuer sous incertitude: risques et décision ÎMoyenne et estimation ÂComparaison (tests paramétriques) ÎMoyenne Théorique # Moyenne Observée Î2 Moyennes Observées ¾échantillons indépendants ¾échantillons appariés ÂEléments sur les tests non paramétriques

Rappels : statuer sous incertitude

3 situations ? tirage au sort populationéchantillon Pour une variable X : on connaît les paramètres dans la population à quoi peuton s’attendre dans un échantillon ? ? populationéchantillon tirage au sort Pour une variable X : on a calculé les paramètres dans un échantillon à quoi peuton s’attendre dans la population ?

échantill tirage au sorton 1+ CAUSE populationeffet? -tirage au sortéchantillon 2 Pour une variable X : on a calculé les param res ans 2 échantillons peuton conclure à un effet de la cause dans la population ? 4

Faculté de Médecine MontpellierNîmes

MB6– BiostatistiquesStatistiques inférentielles

P. Dujols

: variables quantitatives analyse univariée

Rappels : les 8 étapes des tests (a)

1.Énoncé de la problématique Îquestion Îtype de problème statistique (population, échantillons, type de variable) Îchoix du seuil de signification = risqueα(en général 5%) 2.Hypothèses Îtoujours formulées en termes de populationcar ¾fluctuations d’échantillonnage ¾on veut conclure sur la (les) population(s) dont est/sont extrait(s) le(s) échantillon(s) observé(s) Îtoujours 2 hypothèses ¾hypothèse nulle (H0):« rien ne change, pas d’effet … » yéchantillon(s) extrait(s) au hasard de la même population yen général = inverse de ce que l’on cherche à montrer ¾hypothèse alternative (H1) yéchantillon(s) non extrait(s) au hasard de la même population 3.H0 est supposée vraie

Risques et règles de décision

Âavant la décision … ÎSupposition H0 vraie ÎTest effectué donnant ¾p :(pvalue): degré de signification ¾= probabilité d’avoir une différence au moins égale à celle observée ÂRègle de décision ÎSip≤ α: H0 peu probable⇒rejet de H0 au risque p ÎSip >α: H0 probable⇒non rejet de H0 au risque p

H0 vraie

non rejet de H0

seuilα

écart-réduit rejet de H0

(M.e.l. 18/10/10– LIPCOM)

4.Test ÎChoix du test Îvérification conditions ¾nombre de sujets ¾normalité de distribution des variables Îréalisation (calculs) 5.Lecture dans la table et déduction du p 6.Conclusion statistique Îp >α: non rejet de H0 Îp≤ α: rejet de H0 au risque p 7.Évaluation des biais éventuels Îbiais de sélection Îbiais de classementcf cours biais en LCA Îbiais de confusion 8.Conclusion clinique

réalité

H est vraie 0 H est vraie 1

Année Universitaire 2010  2011

étapes des tests (b)

Risques et règles de décision

décision rejet de H non rejet de H 0 0 1α risqueα 1β(puissance) risqueβ

Ârisqueα ère ÎSeuil de significationouespècerisque de 1 ouerreur de type 1 ÎSeuil de probabilité de rejeter H0 alors que H0 est vraie Îexemple: risque de considérer un produit actif alors qu’il est inactif ÎFixé a priori avant le test ¾en général 5%(mais < 5% dans les essais thérapeutiques si nouveau produit toxique) Ârisqueβ Îrisque de 2ème espèceouerreur de type II ÎSeuil de probabilité de ne pas rejeter H0 alors que H1 est vraie Îexemple: risque de considérer un produit inactif alors qu’il est actif ÎFixé a priori avant le test ¾en général < 20%(parfois > 20% si comparaison de 2 produits à toxicité et coût similaires)

Faculté de Médecine MontpellierNîmes

non rejet de H 0 (différence non statistiquement significative)

Moyenne et estimation (b)

2 ∑ (x−m) i N−1

La différence est peut être suffisamment faible (1α)

C’est peut être par manque de puissance (β)

Comparaison de 2 traitements

ÉchantillonΣxi m = NN m= moyenne observée (âge moyen)≠ μmais voisine m≠m≠m≠m≠… 1 2 3 4 recommencé K fois tous voisins et≠ μ m

Variable X: âge

Moyenne observée

c’est peut être vrai (1β)

c’est peut être faux (α)

− s N

ÂL’écartréduit

ÂPropriétés de lamoyenne observée m ÎVariable aléatoire ¾Moyenne théorique E(m) =μ ¾Variance théorique Var(m)=σ/N 2 ÎLoi de distribution de mdépend de la loi de X et de l’effectif N

Loi de X Unimodale, ?

effectif N

<30

LN (μ, σ/N )

Student à N1 ddl ≈LN (0,1)

MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée

Student à N1 ddl ≈LN (0,1)

≥30

effectif N

LN (μ,σ)

suit

Âmais … souventσinconnu Îσremplacé par écarttype de l’échantillons= (approximation)

Student à N1 ddl

rejet de H 0 (différence statistiquement significative)

Degré de signification et conclusion statistique

Loi de X LN (μ,σ) Unimodale, ? LN (μ, )≈LN (μ, ) σ/Nσ/N

P. Dujols

moyenne théoriqueμ écart-type théoriqueσ

différence cliniquement intéressante ou non cliniquement intéressante

Faculté de Médecine MontpellierNîmes

(M.e.l. 18/10/10– LIPCOM)

Moyenne et estimation (a)

Année Universitaire 2010  2011

Moyenne et estimation (c)

population

Tirage de N individusau hasard

MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée

P. Dujols

Variables quantitatives comparaison univariée

Comparaison Moyenne observée # Moyenne théorique

Î=>4. Test: N > 30 εsuit LN(0,1) Î5. On lit dans table LN (0,1) ¾proba (| écart réduit |≥ε)< 0,001

α0,02 0,03 0,04 0,05 0,060,00 0,01 0,00 +∞2,5761,8812,054 1,96 2,326 2,170 0,10 1,645 1,598 1,555 1,514 1,476 1,440 1,405 0,20 1,282 1,254 1,227 1,200 1,175 1,150 1,126 Table de la loi normale centré réduite Î6. Conclusion statistique ¾rejet de H0 ¾différence hautement significative Î7. biais non évaluables Î8. Conclusion clinique: échantillon présente une glycémie anormalement élevée

(M.e.l. 18/10/10– LIPCOM)

Année Universitaire 2010  2011

Comparaison Moyenne observée # Moyenne théorique

ÂProblème: exemple 1 ÎÉchantillon : 100 obèses ÎCritère de jugement : glycémie m=1,4g/l ; s=0,8g/l ÎQuestion : ont – ils une glycémie anormale (μ= 1g/l) ? ÂRaisonnement Î– m1. Problématique: comparaison m th obs Î2. Hypothèses ¾H0: population d’où provient l’échantillon aμ= 1g/l ¾H1: population d’où provient l’échantillon aμ ≠1g/l Î3. Sous H0, calcul deε m ε= s ε=(1,4−1) /0,8/100=4/0,8=5N

Comparaison Moyenne observée # Moyenne théorique

ÂProblème: exemple 2 ÎÉchantillon : 25 obèses ÎCritère de jugement : glycémie m=1,4g/l ; s=0,8g/l ÎQuestion : ont – ils une glycémie anormale (μ= 1g/l) ? ÂRaisonnement Î1. Problématique: comparaison m – m th obs Î2. Hypothèses ¾H0: population d’où provient l’échantillon aμ= 1g/l ¾H1: population d’où provient l’échantillon aμ ≠1g/l Î3. Sous H0, calcul deε m ε= s ε=(1,4−1) /0,8/25=2/0,8=2,5 N

Faculté de Médecine MontpellierNîmes

MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée

P. Dujols

Comparaison Moyenne observée # Moyenne théorique

Î4. Test: N < 30 =>εsuit Loi de Student à 24 ddl Î5. On lit dans table Student à 24 ddl ¾proba (|écart réduit|≥ε)< 0,02 Î6. Conclusion statistique ¾rejet de H0 ¾différence significative Î7. biais: non évaluables Î8. Conclusion clinique: échantillon présente une glycémie anormalement élevée

2 moyennes observées: échantillons indépendants «grands»

CAS où N et N tous les 2 grands (≥30): test de l’écart réduit 1 2 3. On suppose H0 vraie:μ1=μ2 Îm1 suit LN (μ1,s1/N1 ) Îm2 suit LN (μ2,s2/N2) 2 2 s s 1 2 ÎLN(0, )m1m2 suit + N N 1 2

4. On calcule écartréduitεqui suit LN (0,1) 5. on lit table LG(0,1)p = proba(|écart réduit|≥ ε) 6. Conclusion statistique Îp > 0,05 (ε< 1,96) on ne rejette pas H0 Îp≤0,05 (ε ≥1,96) on rejette H0 au risque p

(M.e.l. 18/10/10– LIPCOM)

Année Universitaire 2010  2011

Comparaison de 2 moyennes observées

ÂE1 et E2 sont «probablement égaux» Îs’ils proviennent au hasard de la même population Îsi les moyennes observées sont des « fluctuations » ÂFormulation des hypothèses ÎH0 : E1 et E2 sont extraits au hasard d’une même population (μ1= μ2) ÎH1 : E1 et E2 non extraits au hasard ouμ1≠μ2 Â2 CAS Îéchantillons «indépendants»: E1 (N1) et E2 (N2) ¾N1 et N2 tous les 2 grands (≥30) ¾N1 ou N2 petit (<30) Îéchantillons appariés: ¾N grand (≥30) ¾N petit (<30)

2 moyennes observées: échantillons indépendants

ÂProblème: exemple 3 Î2 groupes de 100 patients avec diabète de type2 ÎFacteur étudié: hypoglycémiant (gr1) et placebo (gr2) ÎCritères de jugement: glycémie Îs1=0,5g/l et m2=1,4g/l ; m1=1,2g/l ; s2=0,8g/l ÎQuestion: traitement hypoglycémiant efficace? 1. Problématique:2 moyennes obs, 2 échantillons indép 2.Test:Hypothèses: H0:μ1 =μ2 et H1:μ1≠μ2 3. SousH0, N≥30 =>εsuit LN(0,1), calcul deε= 2,11 4 et 5. table LN(0,1)proba (|écartréduit|≥ ε) => p < 0,04 6. Conclusion statistique: p<α=0,05 => rejet de H0; différence significative 8. Conclusion clinique:si aucun biais, ttt efficace

Faculté de Médecine MontpellierNîmes

MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée

P. Dujols

2 moyennes observées: échantillons indépendants «petits»

CAS où N ou N petit (<30) 1 2 ET X gaussienne dans la Population d’où est extrait E 1 X gaussienne dans la Population d’où est extrait E 2 2 2 les variances s et s sont égales statistiquement 1 2

m−m 1 2 ε= 1 1 s+ N N 1 2

Test de Student

2 2 (N−1)s+(N−1)s 1 2 1 2 N+N−2 1 2

Âon suppose H0 vraie:μ1 =μ2 Âon calcule écartréduitεqui suit loi de Student à N1+N22 ddl Âon lit dans Student à N1+N22 ddl : p = proba(|écart réduit|≥ε) Îon ne rejette pas H0p > 0,05 Îp≤0,05 on rejette H0 au risque p

2 moy obs: 2 échantillons non indépendants «appariés»

ÂSéries appariées : Recueil d’une même variable chez le même sujet Îà des temps différents ou Îpar des observateurs différents

x 1 x 2 … x N E 1

y 1 y 2 … y N E 2

E et E même taille N 1 2 correspondance entre x et y i i

x - y 1 1 x - y 2 2 … x - y N N échantillon des différences

(M.e.l. 18/10/10– LIPCOM)

Année Universitaire 2010  2011

2 moyennes observées: échantillons indépendants «petits»

ÂProblème: exemple 4 Î2 groupes de 25 patients avec diabète de type2 ÎFacteur étudié: hypoglycémiant (gr1) et placebo (gr2) ÎCritères de jugement: glycémie Îs2=0,8g/ls1=0,5g/l et m2=1,4g/l ; m1=1,2g/l ; ÎQuestion: traitement hypoglycémiant efficace? 1. Problématique:2 moyennes obs, 2 échantillons indép 2.Test:Hypothèses: H0:μ1 =μ2 et H1:μ1≠μ2 3. SousH0,variances supposées égales et glycémie suit LN Îcalcul de s2 = 0,445 puis deε= 1,06 4 et 5. table studentà 25+252 ddl => p > 0,05 6. Conclusion statistique: p >α=0,05 => non rejet de H0 différence non significative 8. Conclusion clinique:ttt non prouvé efficace 22

2 moy obs: 2 échantillons non indépendants «appariés»

ÂStratégie 2. Formulation des hypothèses ÎH0 échantillon des différences (moyenne d) est extrait au hasard d’une population où moyenneδ= 0 ÎH1 :δ ≠0 3. On calcule Îla moyenne des différences Îl’écarttype de la différence moyenne ÂOn est ramené au problème de comparaison d’un échantillon avec différence moyenne observée d à une population où différence moyenneδvaut 0

Faculté de Médecine MontpellierNîmes

MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée

P. Dujols

2 moy obs: 2 échantillons non indépendants «appariés»

ÂIntérêt des séries appariées: ÎLa variance de la différence (XY) pour 2 échantillons appariés est souvent plus faible (corrélation positive) que pour 2 E indépendants 2 2 2 Îσ=σ+σ– 2 cov (X,Y) (XY) X Y Âconséquences Î« plus de chances de rejeter H0 » ÎPour la même différence recherchée, et risques d’erreur consentis, le nombre de sujets à inclure est inférieur ÂConditions d’utilisation: Îcomparabilité des 2 échantillons appariés pour tous facteurs sauf pour facteur étudié Îessais croisés (crossover) cf cours épidémio + LCA

Tests non paramétriques appliqués aux variables quantitatives

ÂPrincipe ÎTests basés sur les rangs et non sur les valeurs ÂAvantages: ÎPas de condition d’utilisation ÎPeuvent être utilisés dans tous les problèmes ÎPlus efficaces que tests paramétriques quand conditions de validité de ces derniers non vérifiées ÂInconvénients: ÎPerte d’information par rapport aux tests paramétriques ÎSouvent moins puissants que tests paramétriques

(M.e.l. 18/10/10– LIPCOM)

Année Universitaire 2010  2011

Éléments concernant les tests non paramétriques

Tests non paramétriques appliqués aux variables quantitatives

ÂComparaison de 2 moyennes observées

CAS où N ou N petit (<30) 1 2 ET les conditions X gaussienne dans la Population d’où est extrait E 1 X gaussienne dans la Population d’où est extrait E 2 2 2 les variances s et s sont égales statistiquement 1 2 vérifiées

Test de Student

Test non paramétrique

de Mann-Whitney Wilcoxon

Faculté de Médecine MontpellierNîmes

MB6– BiostatistiquesStatistiques inférentielles : variables quantitatives analyse univariée

P. Dujols

Conclusion & récapitulatif

(M.e.l. 18/10/10– LIPCOM)

problématique Comparaison m àμ obs

Comparaison de 2 m indépendantes obs

Comparaison de 2 m dépendantes obs

Comparaison de k m indépendantes obs