Plan du cours Methodes de statistique inferentielle. 1 Introduction A. Philippe 2 Probabilites : Variables Aleatoires ContinuesLaboratoire de mathematiques Jean Leray Universite de Nantes Anne.Philippe@univ-nantes.fr 3 Estimation Version modi ee le 23 avril 2009 4 Tests Ce cours est destine aux etudiant(e)s de l’IUT de Nantes, 5 liere GEA, 2eme annee. Regression http://www.math.sciences.univ-nantes.fr/~philippe/ A. lippe (U. Nantes) Methodes de statistique inferentielle. 23 avril 2009 1 / 166 A. lippe (U. Nantes) Methodes de statistique inferentielle. 23 avril 2009 2 / 166 Introduction Introduction Plan de la section Quelques problemes 1 Un fabricant souhaite veri er la qualite des ampoules electriques produites par une nouvelle cha^ne de production. Il faut donc evaluer la duree moyenne de fonctionnement des ampoules. 1 Introduction Comment evaluer cette duree moyenne ? On ne peut pas tester toutes les ampoules ! 2 Le responsable d’un parti politique souhaite estimer la proportion des militants favorables a la candidature de Mr X pour la prochaine election presidentielle. Comment calculer la popularite d’un candidat au sein d’une population ? Interroger tous les militants est trop cou^teux. A. lippe (U. Nantes) Methodes de statistique inferentielle. 23 avril 2009 3 / 166 A. lippe (U. Nantes) Methodes de statistique inferentielle. 23 avril 2009 4 / 166Introduction Introduction Population& Echantillon Pour resumer De nition La population : l’ensemble de tous les elements ...
Comment´evaluercettedure´emoyenne? On ne peut pas tester toutes les ampoules ! 2Le responsable d’un parti politique souhaite estimer la proportion desmilitantsfavorablesa`lacandidaturedeMrXpourla prochaine´electionpr´esidentielle. Commentcalculerlapopularite´d’uncandidatauseind’une population ? Interrogertouslesmilitantsesttropcoˆuteux.
Le fabricant d’ampoules. Ilpre´l`eveun´echantillonconstitu´ede130ampoules. Pourchaqueampoule,ilmesureladure´edefonctionnement. Lamoyennedel’e´chantillonvaut36000heures. Une estimation pour la population est 36 000 heures. Le responsable du parti. Ilconstitueune´chantillondetaille400.Parmilespersonnes ´lectio´ees,250sontfavorablesaucandidatpropos´e. se nn Uneestimationdelaproportiondelapopulationfavorable`aMr X est 250/400 = 0.625
Quelleestlaqualite´decesdeuxestimations?
A. Φlippe (U. Nantes)el.itleeisqtuaedteissdteertehnoinMf´´
23 avril 2009 7 / 166
Pour resumer ´
Introduction
A. Φlippe (U. Nantes)lle.ituqiefne´ertneith´eesodstdeisatM
Introduction
Erreurd’e´chantillonnage
23 avril 2009
6 / 166
Ellere´sultedel’utilisationd’unsousensembledelapopulation (l’e´chantillon)etnondelapopulationtouteentiere. ` Exemple : le responsable du parti (suite).tsenidsnre´fftnahollideux´ec
Quelleestlaprecisiondesestimationsr´ealis´ees? ´
A. Φlippe (U. Nantes)
M´ethodesdestatistiqueinf´erentielle.23 avril 2009
8 / 166
Probabilit´es:VariablesAl´eatoiresContinues
Plan de la section
2onsCnutiat´ereoisear:Vest´AlesbliaPilibabor G´ene´ralite´s Loi gaussienne/normale
A. Φlippe (U. Nantes)
M´ethodesdestatistiqueinf´erentielle.
Probabilite´s:VariablesAle´atoiresContinues´s´tliaer´eG en
23 avril 2009 9 / 166
Unexempledeloidiscr`ete:laloiBinomiale
Unhoˆtelposs`ede50chambres.Auprintempsletauxderemplissage est de 75%. On noteXnolerembtcuhndeesueep´cuocesbramse’C.e´nnodruojn variableal´eatoire. X∈ {0, . . . ,50}prend un nombre fini de valeurs, c’estunevariableal´eatoirediscre`te. La loi deXest laloi binomialede parametren= 50 etp= 0.75. ` c’est`adire,pourtoutk∈ {0, . . . ,50}, on a P(X=k) =Ckpk(1−p)50−k 50 Laprobabilit´equel’hˆotelsoitcompletvaut P(X= 50) =C05500.7550(1−0.75)0= 0.7550
A. Φlippe (U. Nantes)nere´fni.elleitteoh´Mestadesdiquetist
Unevariableale´atoirediscre`teprendunnombreauplus de´nombrabledevaleurs.L’ensembledesvaleursprisesparX peutdoncs’´ecriredelaforme{xi,i∈E}uo`Eest un sous ensemble deN Laloidelavariableal´eatoireXilibse´tpsedaborastlteuies pk=P(X=xk) pour toutk∈E L’esperance (moyenne) deX: ´ E(X) =Xpkxk k∈E La variance deX: XX!2
On noteXle temps de vol entre Paris et Vilnius. C’est une variable ale´atoirequiprenddesvaleurscomprisesentre135mnet165mn. Lavariableal´eatoireXpeut prendre toutes les valeurs de l’intervalle [135,165]. Cettevariablealeatoiren’estdoncpasunevariablediscre`te. ´
Probabilite´s:VariablesAl´eatoiresContinues´itals´ee´G ner
Calculdesprobabilite´s
23 avril 2009 13 / 166
L’airecommemesuredesprobabilite´s SoitXuabrivanenieu,oirecontleal´eatfedsntie´as De´finition Laprobabilite´queXappartiennea`l’intervalle[a,b]P(a≤X≤b) este´galea`l’aireendessousdelacourberepre´sentativedeladensite´ comprise entre x=a et x=b
Autrement dit b P(a≤X≤b) =Zf(t)dt a
A. Φlippe (U. Nantes)´Meddsteohtistestainf´ique.leenerelti
Laloid’unevariableal´eatoirecontinueestde´finiea`partid’ r une fonctionfe´eppleaneisdt´eteans:se´tviusporpe´ireleserifiuiv´q fest positive pour toutx∈R,f(x)≥0 l’aire en dessous la courbe repre´sentativedefvaut 1 autrement dit Z∞−∞ f(x)dx= 1
1eatoeal´iredeleis´tailbvarableubeencourLadanetnlee´eserrp 2L’aise´eprreentozaledertrevneen sur l’image de gauche :P(X≤a) sur l’image du milieu :P(a≤X≤b) sur l’image de droite :P(X≥b)