//img.uscri.be/pth/6f2dc08d0cff837a2f93646ecc0717efe1c6b88f
Cet ouvrage fait partie de la bibliothèque YouScribe
Obtenez un accès à la bibliothèque pour le lire en ligne
En savoir plus

Association entre l'exposition à la pollution atmosphérique et la santé : utilisation des séries chronologiques.

24 pages

Eilstein (D), Larrieu (S), Lefranc (A), Wagner (V), Zeghnoun (A). http://temis.documentation.developpement-durable.gouv.fr/document.xsp?id=Temis-0069109

Ajouté le : 01 janvier 2009
Lecture(s) : 0
Signaler un abus

JournaldelaSocie´t´eFranc¸aisedeStatistique
Volume 150, nume´ ro 1, 2009

Associationentrel’exposition`alapollution
atmosphe´riqueetlasante´:utilisationdess´eries
chronologiques
Daniel Eilstein1, Sophie Larrieu2, Ve´re`ne Wagner3, Abdelkrim Zeghnoun4et
Agnes Lefranc5
`

Title

Relationships between air pollution and health : a time series study

R´esume´
Au cours des vingt derni` s anne´es, l’analyse des liens a` court terme entre la pollution at-
ere
mosph´eriqueetlasant´eafaitl’objetdenombreuxtravaux.Lame´thodelaplussouventutilise´e
estl’analysedes´erieschronologiques.Celle-civise`aquantifierleslienspouvantexisterentreles
variations quotidiennes du niveau d’un indicateur d’exposition a` la pollution atmosphe´rique et celles
dunombred’occurrencesd’un´eve´nementsanitaire(de´c`es,hospitalisations,etc.).Afind’obtenirune
estimationnonbiais´eedel’associationa`courttermeentrelapollutionatmosphe´riqueetlasant´e,il
est ne´cessaire de prendre en compte dans l’analyse tous les facteurs susceptibles de modifier cette
association (ces facteurs doivent pre´senter des liens avec les niveaux de l’indicateur de pollution at-
mosph´eriqueetavecl’indicateursanitaire).L’approcheactuelleestuner´egressiondePoissonbase´e
surunmod`eleadditifgene´ralise´(GAM).Cedernierrecourt`adesfonctionsdelissagequipermettent
´
d’ajuster le mode`le au plus pre`s de la forme des relations entre la variable sanitaire et les variables
explicatives.Aussi,sontint´egr´esaumode`lelavariabled’inte´rˆet(teneursatmosphe´riquesd’unpol-
luant)ainsiquelatendancea`longtermeetlasaisonnalit´e,lejourdelasemaine,lesjoursf´eri´es,
lespe´riodesdevacances,lesconditionsm´ete´orologiques(temp´erature),les´episodesdegrippe,les
pe´riodesdepollinisation,etc.Lesdonn´eessanitairespre´sententsouventunesurdispersionquiest
priseencompteparl’hypoth`esed’unedistributionquasi-poissonniennedelavariablesanitaire.Les
param`etresdelafonctiondelissage(splineenp´isalcendanlateetpmocneerdnerprouep´eisilute)´e
`alongtermeetlasaisonnalit´esonts´electionne´sdefa¸con`aminimiserl’autocorr´elationpartielledes
re´sidus.Lemod`eleder´egressionpermetd’estimerlecoefficientassocie´`al’indicateurdepollutionet
decalculerunrisquerelatif.Lar´ep´etitiondetellese´tudesdes´erieschronologiquessurdesp´eriodes
successivesesttre`sutilecarellepermetd’assurerunesurveillancee´pid´emiologiquedesliensacourt
`
termeentrepollutionatmospheriqueetsante´graˆcea`desdonn´eesenregistre´esenroutine.
´
Mots-cl´es:utllnaioostm´ephuqire´,e´dipoimelogie,s´erieschrnologoqieu,som`ditddeaelifPo
generalise.
´ ´ ´
1Institut de veille sanitaire,d.eilstein@invs.sante.fr
2Institut de veille sanitaire,sophie.larrieu@invs.sante.fr
3Institut de veille sanitaire,v.wagner@invs.sante.fr
4Institut de veille sanitaire,a.zeghnoun@invs.sante.fr
5Institut de veille sanitaire,a.lefranc@invs.sante.fr

JournaldelaSoci´et´eFran¸caisedeStatistique,150(1), 30-53
,
http://smf.emath.fr/Publications/JSFdS/
ceciSo,2ce900deueanFrme´hqita´te´taMeueetSocitatistiqa¸sideSe´tFearcn
´

1

Eilstein et al.

Abstract

During the past twenty years, short-term relationships between air pollution and health have been
largely investigated, mainly through time series studies. Their aim is to estimate the association bet-
ween daily levels of an air pollution indicator and daily numbers of a health event (death, hospital
admission, etc.). In order to get a non-biased estimation of this short term association, all factors
which can modify this relationship have to be taken into account (these factors are related to air
pollution and health events). The current approach consists of using a Poisson regression based
on a Generalized Additive Model (GAM). This model fits nonparametric functions to allow for non-
linear effects and provide a better estimation of the relationships between the different variables. The
following factors are included in the model : long-term trend and seasonality, day of the week, holi-
days, vacations, temperature, influenza epidemics, pollen counts, and the indicator of air pollution. A
quasi-Poisson distribution allows taking into account the frequently observed over dispersion of the
health data series. The parameters of the smoothing function (penalized spline) used for trend and
seasonality are chosen in order to minimize the partial autocorrelation of the model residuals. This
model allows to estimate the parameter of the pollutant in this multivariate model and to estimate a
relative risk. Repeating such a study on successive periods is very useful in order to provide a real
epidemiologic surveillance on the health risks related to air pollution, based on routinely registered
data.
Keywords :Air pollution, Epidemiology, Time series, Generalized Additive Model.

Mathematics Subject Classification:(62M10, 62G08, 62P10)

Introduction

31

L’analysedesrelationsentrel’expositiondespopulations`alapollutionatmosphe´riqueet
la sante´ fait l’objet d’un tre`s grand nombre de travaux. On distingue, aujourd’hui, deux grands
types d’effets sanitaires : les effets dits«a` court terme»saai,ft`alemen’ex-tiietnusidtamme´
position(conventionnellement:survenantquelquesjoursauplusapr`escelle-ci)etleseffets«a`
long terme»´il,alopeua`noqicnrhitioxposuneees`aredsreinuqireC.eostm´ephutllnaiossont
approch´es,eng´ene´ral,a`l’aidedeme´thodesrelevantdel’analysedesurvie,fond´eesurlesuivi
decohortesdesujetsexpose´s`adiff´erentsniveauxdepolluantsetn´ecessitentlesuivisanitaire
individuel de ces sujets [7, 23, 37, 36]. Pour les effets«a` court terme», l’approche la plus
r´epandueactuellementestdetype´ecologique(l’analyseportesurdesdonn´eesagre´g´eesetnon
sur des donne´es individuelles) et utilise l’analyse de se´ries chronologiques [42, 21, 44, 35, 19, 5,
51,10,18,26,45,2,25,12,24,17].Lesse´ries´etudi´eessontsanitairesetenvironnementales.Les
variablessanitairessont,parexemple,lenombreded´ec`esparmaladiescardiovasculaires,par
maladies pulmonaires ou toutes causes confondues (hors les accidents et les suicides), le nombre
d’admissionshospitali`erespourlesmeˆmescauses,lenombredecasd’infarctusdumyocarde,
de crises d’asthme, le nombre de de´livrances de me´dicaments pour certaines pathologies, etc.
[42, 44, 5, 35, 45, 51, 10, 26, 25, 12, 24, 17]. Les variables environnementales sont, classique-
ment,lesniveauxdeconcentrationdepolluantsdansl’atmosph`ere,latemp´erature(minimaleet
maximalejournali`eres),l’humidit´eoulapressionatmosphe´rique,lesniveauxdepollensdans
l’air,etc.Lesindicateursdepollutionatmosph´eriquelesplussouvente´tudie´ssontledioxyde
de soufre, les particules, le dioxyde d’azote (NO2) et l’ozone, notamment, car ils sont mesure´s
en routine dans la plupart des grandes agglome´rations. Les effets propres de la plupart d’entre
euxsurlasante´ont´et´ebiendocumente´sdanslecadred’´etudesexp´erimentales.Chacundeces

JournaldelaSoci´et´eFranc¸aisedeStatistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
ce,2Fran009´hmeMetaeuedtaqitatiedeS¸aisrance´´toSiceutetsqiFe´te´icoSc

32

Airetsant´e:utilisationdess´erieschronologiques

polluants est par ailleurs un«traceur»d’une source ou d’un type de pollution atmosphe´rique.
L’analyse aboutit a` l’estimation de risques relatifs (RR) qui quantifient la force de l’association
statistique entre les variations de concentrations du polluant et celles de l’indicateur sanitaire.
En 1997, l’Institut de veille sanitaire (InVS) a mis en place un dispositif de surveillance
deseffetsdelapollutiondel’airsurlasant´edelapopulationfran¸caisedansneufvillesdela
m´etropole(Bordeaux,LeHavre,Lille,Lyon,Marseille,Paris,Rouen,StrasbourgetToulouse)
suite`alaLoisurl’airetl’utilisationrationnelledel’e´nergiede1996.L’objectifdecepro-
grammeestd’´etudierlesrisquessanitairesassociesal’exposition`alapollutionatmosph´erique
´ `
etdesuivreleurs´evolutionsdansletemps.Ainsi,depuissamiseenplace,ceprogrammea
permisd’estimer,surplusieurspe´riodescons´ecutives,lesrelationsa`courttermeentrepollution
atmosphe´riqueetsant´edansces9agglom´erations[19,18].Ceprogrammeapourobjectifde
fournir des outils me´thodologiques pour l’application des recommandations de la surveillance
qui,contrairementa`larecherche,ne´cessitelerecoursa`desm´ethodes«re´actives»t`adees
donn´eesfacilementaccessiblesenroutine.Ceciexpliquequel’InVS,pourassurersamission
deveillesanitaire,aitopt´epouruneapproche´ecologiqueparanalysedese´rieschronologiques.
Lesdonne´esdemortalit´e(nombresdede´ce`sjournalierspourunepathologiedonne´edanscha-
cunedesvillesdudispositif)peuventeˆtreobtenuesaupr`esduCentred’e´pide´miologiesurles
´edicalesded´ec`es(C´epi-DC),lesdonn´eesd’admissionshospitalie`res(nobrejourna-
causes m m
lierd’hospitalisationspourunemaladiedonn´ee)sontextraitesdesfichiersduProgrammede
me´dicalisationdessyste`mesd’information(PMSI)ge´n´eralis´eauxhˆopitauxpublicsetprive´s,
g´ere´parlesD´epartementsd’informationme´dicale(DIM)decese´tablissements.Cesdonn´ees
sontcollecte´esenroutine,`adesfins´epid´emiologiques(de´ce`s)oume´dico-e´conomiques(PMSI)
etdoncdisponiblesavecunde´calagecorrespondant`alaconsolidationdesdonn´eta`leurmise
ees
a disposition. Notons (mais c¸a n’est pas l’objet de cet article) qu’a` partir des RR, il est possible,
`
lorsqu’unensembledecrit`eresmontreunefortepr´esomptiondecausalite´[16],decalculerun
nombredecas(de´c`es,admissions)attribuablea`uneaugmentationdonne´edupolluant.
Nousnousproposons,danscetarticle,depre´senterlam´ethodeutilis´eedanslecadredece
programmepoure´tudierdesrelations`acourttermeentrel’expositiona`unpolluantetl’occur-
renced’e´v´enementssanitaires.Dansunpremiertemps,nouspre´senteronsleprincipedecette
methode;puisnousd´etailleronslemod`eleutilise´etlanaturedesdonne´esn´ecessaires;enfin,
´
nous illustrerons ces notions par un exemple issu de l’analyse des liens a` court terme entre les
concentrations enNO2e’aslloggerm´ioatmaltatro´tilnadeiodep´er-2000roeddnBerualuasx
2004.

2 Principe

L’approcheretenuepour´etudierl’associationa`courttermeentrelesniveauxdelapollution
atmosph´eriqueetlescomptesjournaliersd’unindicateursanitaireestdetypee´cologiquetem-
porel.L’e´tudereposesurdesdonneesagr´eg´ees`al’e´chelledel’agglom´erationetnonsurdes
´
donne´esindividuelles.L’unit´ed’observationestlejour.Parcons´equent,lesfacteursindividuels
qui sont constants dans le temps, comme le sexe, ou les facteurs dont la distribution dans la
population´etudi´eenevariepasd’unjour`al’autre,commeletabagisme,n’influencentpasla
relation e´tudie´e et n’ont pas besoin d’eˆtre pris en compte dans l’analyse. En revanche, tous les

JournaldelaSocie´t´eFranc¸aisedeStatistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
c900,2ceanrFedeuqitame´htat´´eraeFciSoci´et´eMiqueetSoSeatittscna¸side

Eilstein et al.

33

facteurs pouvant varier au cours du temps avec les niveaux de l’indicateur d’exposition a` la
pollutionatmosph´eriqueetl’indicateursanitairepeuventconduire`aunbiaisdansl’estimation
de l’association existant a` court terme entre ces deux indicateurs. Le principe de base de la
mod´elisationdesliensa`courttermeentrepollutionatmosphe´riqueetsant´ereposedoncsurle
controˆ le ade´quat de ces facteurs dits de confusion.
Lesindicateurs sanitaires(variables explique´es) tels que la mortalite´, les admissions hospi-
talieres,lesoccurrencesdecaspathologiquesoulad´elivrancedesme´dicaments,ge´n´eralement
`
enregistr´essurunpasdetempsjournalier,sontcaract´eris´esparunfaiblenombred’´´nt
eveneme s
quotidiens survenant au sein d’une population d’effectif relativement important. Le nombre
journalierd’´eve´nementssanitairespeutˆetremod´elis´eparunevariableal´eatoiredontladistri-
bution suit une loi de Poisson. Ces indicateurs sanitaires pre´sentent aussi des variations tempo-
relles`alongterme(tendance),a`moyenetcourttermes(variationssaisonni`eres,hebdomadaires,
journalie`res,...),uneautocorre´lationdescomptesjournaliers(d’e´v´enementssanitaires)etune
surdispersiondecesderniers(lavariancedesdonne´esobserv´eesestsouventsupe´rieurea`lava-
riancethe´oriqueetdonc`alamoyennedelavariablecompte journalier). Cette autocorre´lation
etcettesurdispersiondesdonn´eessonthabituellementlie´esa`desphe´nom`enesexternesa`la
variableexpliqu´ee,identifi´es(conditionsm´ete´orologiques,´epide´miesdegrippe,pollens)mais
aussi`adesvariationssaisonni`eresrepr´esentativesded´eterminantsnonmesur´es.
Lesindicateurs de pollutionmusia`edvsraai-on(cntceitarjsnonruo`ilaeseron)sustasosi
tions`acourt,moyenetlongtermes,duesessentiellementauxvariationsd’´emissiondeces
polluantseta`desfacteursme´te´orologiquesintervenanta`moyen(saisons)et`acourttermes.Ils
pre´sentent aussi des autocorre´lations.
Parailleursd’autresfacteurs,commelatempe´rature,l’humidit´erelativeoulese´pid´emies
de grippe interviennent comme facteurs de confusion potentiels puisque leurs variations tempo-
relles`acourttermesontlie´esa`lafois`acellesdespolluantseta`cellesdesdonne´essanitaires
[21, 27, 19, 18]. La prise en compte de ces facteurs environnementaux et temporels permet
generalementdestationnariserlas´erie,dere´duirel’autocorr´elationetlasurdispersion.
´ ´
L’e´tude de la relationentre les indicateurs sanitaires et les indicateurs de pollution doit
donc tenir compte :
1.delatendance`alongtermeetdesvariationssaisonni`eresdesdiffe´rentesvariables;

2. des facteurs de confusion potentiels ;
3.del’autocorr´elationdesdonn´eesauseindesse´riesd’indicateurssanitairesetenvironne-
mentauxintervenant`acourtterme;

4.delasurdispersiondel’indicateursanitaire(lamortalit´e,dansl’exemplequiserap´esent´e
r
ici).

Danslespremierstravauxduprogramme[21,44],etjusqu’a`lafindesanne´es90l’analyse´etait
bas´eesurunere´gressiondePoissonetunmod`eleline´aireg´en´eralis´e(GLM)[32,21,27].Elle
exprimait le logarithme ne´pe´rien de la moyenne journalie`re de l’indicateur sanitaire comme une
combinaisonline´airedesvariablesexplicatives(tendance,variationssaisonni`eres,´epid´emiesde

JournaldelaSocie´te´Fran¸caisedeStatistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
eeuqitsitatSedes´ethMa´eeti´octScn,eFearuqdeamit2009e´te´icoia¸cnarFSc

34

Airetsant´e:utilisationdess´erieschronologiques

grippe,temp´erature,polluant,etc.):

Yt∼P(µt) etµt=E(Yt),
p
ln(µt) =ηt=Xβjxtj
j=1
ou`Ytest la variable a` expliquer au tempst(t= 1,2, . . . , T) et repre´sente l’indicateur sanitaire,
µttlessp’era´ecndeeYt, au tempst,ηtestlepr´edictsmpe´nilrueetuaeriat. Lesβjsont les
`
parame`tres a` estimer,xtjest la valeur dujeme)´t,ete.ce,humidip´eraturfitamet(xerucilpfteac
au tempst’dtaasegdtu’lisence,mblaaiselavredluclacuasee´ilnssoaisrdeurPo.rtbieu`ra
lafonctiondelienlaformed’unefonctionlogarithmen´ep´erien(l’expressionformelledela
loi de Poisson s’accorde bien a` la forme logarithmique du lien en simplifiant le calcul de la
vraisemblance).
Pourprendreencompteune´eventuellenon-line´arit´eentrelavariablea`expliqueretles
variablesexplicatives,unmode`leadditifge´ne´ralis´e(GAM)a´ete´utilise´parlasuite[11].Ce
derniermode`len’estenfaitqu’uneextensionduGLM:lepr´edicteurline´aireduGLMest
remplace´ par un pre´dicteur dit additif [14] :

Yt∼P(µt) etµt=E(Yt),
p
ln(µt) =ηt=Xfj(xtj),(1)
j=1
V ar(Yt) =τ µt
Larelationentrelavarianceetl’espe´rancedeYtrepr´esentel’extra-variabilit´epoissonnienne
(mod`elequasi-Poisson).Lesfonctionsfjsont des fonctions quelconques d’une ou plusieurs va-
riables.Ellespeuventˆetreparame´triques(polynomiales,trigonom´etriques,splinesoiss,n´rederge
etc.) ou non parame´triques (splinestriquesonparam´eonln-oiossreegr´densiotcnof,egassiledu
caleponde´re´e[42,43]).L’utilisationdetellesfonctionsre´sumeengrandepartiel’int´ereˆtdes
GAM puisqu’elle permet d’appre´hender avec peu d’a prioriforme de la relation unissant lesla
variables explicatives et la variable a` expliquer.
Actuellement, dans la the´matique«air sante´», ce sont les fonctionssplinesqui sont les plus
utilise´es.Rappelonsque,sil’onconsid`ereunesuitedonne´edeknœuds(ξj)j=1,...,k, une fonc-
tionsplines(x)d’ordremest, par de´finition, une fonction polynomiale par morceaux, de degre´
(m−1)euxntreden´eerlaguivenudeaisseL.sfsduœccusir´tdees(x)mposantusur´eenietsnsa
certainnombredecontraintesdecontinuit´eoudenullite´surlesde´riv´eessuccessivesdes(x)aux
points-nœuds(ξj)j=1,...,k. Ces contraintes varient selon le type de fonctionssplinesconstruites
(puissances tronque´es,B-splines,natural-splines, etc.). Les fonctionssplinesennentd´seliec
deux groupes : lessplinesiossreegestlneed´rsplinesde lissage. Lessplinesder´egrseisno
pre´sententdesqualit´esmathe´matiquesdeparlasimplicite´descalculsetuneexpressionexpli-
cite :
m k
s(x) =Xθjxj−1+Xδj(x−ξj)m+−1(2)
j=1j=1
o`u(x−ξj)+=max(0, x−ξj)etϕ= (θ1, . . . , θm, δ1, . . . , δk)est le vecteur des coefficients
a estimer selon une me´thode de re´gression line´aire classique. De fac¸on a` simplifier la notation,
`

JournaldelaSocie´t´eFranc¸aisedeStatistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
900,2ceanFrdeeuqitame´htaMe´tcicoS´te´ittsqieuteoSice´eFranc¸aisedeSta

Eilstein et al.

onde´finitlabasedefonctionsdepuissancestronqu´ee
Bj(x) =xj−1, j= 1, . . . , m
Bm+j(x) = (x−ξj)+m−1, j= 1, . . . , k
L’expression(2)peutalorss’´ecrirecomme:

35

m+k
s(x) =XϕjBj(x)
j=1
L’utilisation des bases de fonctions de puissances tronque´es peut entrainer certains proble`mes
de stabilite´ nume´rique, rendant parfois de´licate la mise en œuvre sur le plan pratique. Une autre
basebeaucoupplusutilis´eequecelledespuissancestronqu´eesestcelledesB-splines. Celles-ci
sontsouventpre´fere´espourleursproprie´t´esnum´eriquesetpourleurfacilite´demiseenœuvre
´
algorithmique [6, 9].
Lesnatural-splinessont des fonctionssplinesnie´deleiatnnortunecavecxtiramie´´sopuaee
extre´mit´es,viauned´erive´esecondenullesurlespremieretderniernœuds,cequilaissemoins
delibert´ea`lafonctionmaisstabiliselavariancedesestimationsauxextr´emit´es.Lesfonctions
splines`tarbeenumoelasosfurfnedti’cnnoder´egressionllE.osseestnbisnenv´ntieajsmrseu
lapositiondesnœuds.Ajouterunnœudsuppl´ementaireouled´eplacermodifielaformedela
relation.Deplus,lapositiondesnœudsestsouventdistribue´euniforme´mentsurlesdonn´ees.
L’ajustementdanslesr´egionsavecpeudefluctuationsdanslesdonn´eessefaitalorsavecle
memenombredeparam`etresquedanslesr´egionspre´sentantbeaucoupdevariabilite´.
ˆ
L’autre groupe desplinesoisntriques:lesfonct´sdefenosectmoopnparam´ectionsnosplines
de lissages. Contrairement auxsplinesreddehoetm´ottˆlusptnosilesdtsevuneessi´egriutionqu
intuitivesouparessaiseterreurspourd´eterminerl’ensembledesnœuds,lessplinesde lissage
de´terminent les nœuds en minimisant un crite`re bien pre´cis. Celui-ci combine la mesure clas-
siquedelaqualit´edel’ajustement,lasommedescarre´sdesr´esidusetunemesuredudegr´ede
lissage(d´efinieiciparuneinte´grale):
i=1yi−f(x+λZ
n1Xin)2f(m)(t)2dt
`λm`etredestleparateegassilmlonyedpsrge´eleds.st´esajuˆome´xfitseirfin´eadt`ertsee
ou e
Leparam`etredelissagede´terminelaflexibilit´edel’estimateur.Plusλest proche de0, plus
l’estimateur est flexible. Plus on augmente la valeur deλtancmporae`alnoodlpsulei’nnde,
deuxie`mepartieducrit`ereet,decefait,plusl’estimateurestlisse.Ila´ete´montre´quel’unique
fonctionquiminimisececrit`ereestunenatural-spline´edegrde2m−1avec des nœuds a`
chacune des valeurs distinctes de la variable explicative.
Lessplinesee´ssdlenoegassitnava’ltebesedagrusueras`trecnircesipe´renda.Ceptilint,u
dans le cadre des GAM, leur emploi peut induire une sous-estimation de la variance quand
plusieurs fonctions non parame´triques sont incluses dans le mode`le et lorsque les variables
sontcorr´ele´es[39].Unealternativecombinant`alafoislaflexibilit´edesfonctionssplinesnon
param´etriquesetlecadrebiend´efinidesGLMreposesurl’utilisationdefonctionssplines
p´enalise´estrevuesceuventˆemoemedse`inpsereC.redssplinesde lissage mais avec plus de

JournaldelaSoci´ete´Franc¸aisedeStatistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
chte´e´aMuqdeamitnce,eFra2009ia¸cnarFtatSedeseequtiiseti´octSSoci´et´e

36

Airetsant´e:utilisationdess´erieschronologiques

flexibilite´danslechoixdesnœuds:lenombreetlapositiondesnœudsnesontpasfix´es.L’ide´e
de´veloppe´e par Eilers et Marx [9, 31] consiste a` positionner plus de nœuds que ne´cessaire
puisa`retirerceuxn’apportantpassuffisammentd’informationenp´enalisantl’expressiondes
moindrescarre´spardesdiff´erencesfiniesportantsurlescoefficientsdesB-splinesadjacentes.
Le degre´ e´tant choisia priori, lessplinesiasee´silane´pluapnuestn’dn-eedd´epies,´efinnsid
rame`tre (de penalisation).
´
Le mode`le (1) met en relation l’indicateur sanitaire et le polluant en tenant compte de l’en-
sembledesvariablesayantunrˆolepr´esum´edanslesvariationsdel’indicateursanitaireetdu
polluant.L’indicateurdepollutionatmosph´eriqueestintroduitdanslemode`lesouslaforme
lin´eaireensoncoefficient:βX(on tient compte de la probabilite´ associe´e au test de significati-
vite´duparam`etreβ). Les autres variables explicatives apparaissent comme fonctionsplinesou
sontnontransform´ees,selonlecas(voirtableau1).
Notonsquecemode`lenemod´elisepasl’autocorr´elationr´esiduelle.Sidel’autocorr´elation
persistedanslesre´sidus,destermesautore´gressifspeuventeˆtreintroduitsdanslemod`ele.
Cetypedemod`elepeuteˆtreestim´eenutilisantlafonctionGAMfourniedanslepackage
mgcvdulogicielR[38].Lelecteurpourraser´efe´rera`l’ouvragedeWood[48]pourunexpose´
de´taill´edesmod`elesGAMetdesfonctionssplines´isalenp´n`aatioilisurutrueleuopsnqiseia
e
l’aide du logiciel R.
L’estimation du coefficient relatif au polluant permet de calculer le RR. Ce dernier est, par
d´efinition,unrapportdeprobabilit´e:

P(M
=
RRP(M||EE))
Aunum´erateurfigurelaprobabilite´depresenterun´eve´nementsanitairelorsqu’onestexpose´
´
aufacteurderisque.Aud´enominateur,laprobabilite´depre´senterl’´eve´nementsil’onn’est
pasexpos´e.SileRRestsignificativementsupe´rieur`a1,dupointdevuestatistique,lefacteur
correspondant est dit«facteur de risque»iles.S’´eritinf`ruei,1atseltid«facteur protecteur».
Danslecasd’uneexposition`alapollutionatmosph´erique,danslamesureo`ul’absencetotale
d’expositionnecorresponda`aucunesituationre´elle,leRRsepr´esenteraplutˆotdelafa¸con
suivante :
RR=PP((MM||EE12))
Avec,aunume´rateur,laprobabilit´edepr´esenterun´ev´enementsanitaire(M),lorsqu’onestex-
´ ` n certain niveau de polluant (la conditionE2correspond au niveau de concentration du
pose a u
polluant,C2’lre´ve´menestne’oilstnepoexeas´unemoua´de),ttnese´rpede´tiliabobprlar,euatin
niveaudeconcentrationder´ef´erence(laconditionE1correspondauniveaudeconcentrationde
ref´erence,C1).
´
L’estimationcentraleduRRestreli´ee`acelleducoefficientβdu polluant par la relation :
RR=eβ(C2−C1)
Le RR est exprime´ par son estimateur central affecte´ d’un intervalle de confiance (ge´ne´ralement
a`95%),dontlesbornessontelles-mˆemesd´etermine´esparuncalculsimilaireauprecedent`a
´ ´
partir des bornes de l’intervalle de confiance de l’estimation du coefficientβ.

JournaldelaSoci´ete´Franc¸aisedeStatistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
naec2,00qieuedrF9euqioSteatSetsith´atatem´ecieMt´oSiccisednc¸aeFra´et´

3

Lemode`le

Eilstein et al.

3.1 Nature des variables introduites dans le mode`le

37

Lemod`eleexprimelelogarithmene´p´eriendel’espe´rancedelavariablesanitairecommeune
somme de fonctions des variablesmetdruoj,spemaielasoursne,j´ise´fredie´´,pegrdeesmi,peip
pollens(si ne´cessaire),`terp´uratxamelamiuojelanri`eretempture´eraameliminanilojruet
ere, em
un indicateur de pollution.
La variablesanitaireoitae,sntipssila.)tc.’´edbromentlesuonrtnjsenemvee´s,hoec`er(d´alie
Elle figure, dans le mode`le, sous forme de logarithme.
La variabletemps.eesjoursdel’´etudaparpanalsıˆdtsedeire´dsecidnile`eodemaselmmco
Elleesttransform´eeparunefonctionsplinearunmpspdutetionilasdoe´L.ma´seee´pilanellete
fonctionvapermettredecontroˆler`alafoislatendanceetlesvariationssaisonnie`res.D’autre
part,ladure´edelape´rioded’observation´etantcourte,lapopulationexpose´esubitpeudeva-
riationsquantitativesouqualitativesaucoursdecettepe´riode.Aussi,fait-onl’hypoth`esequela
population´etudie´evariepeusurlecourtterme.Enfait,lavariabletempsprend en compte la
variation(faible)´eventuelledelapopulation,entailleetenstructure.Leparame`tredelissage
de la fonctionsplinedu temps devra permettre de mode´liser suffisamment l’impact de ces va-
riables tout en e´vitant d’inte´grer l’effet de la pollution. Dans cette optique, la minimisation de
la somme des autocorre´lations partielles des re´sidus guide le choix de ce parame`tre de lissage
[47].
Lejourdelasemaineeste´galementunfacteurdeconfusion:lenombreded´ece`s(plus
encoreleshospitalisations)pre´senteunevariationpe´riodiquehebdomadaire.Ilenestdemˆeme
pour les polluants issus du trafic routier. Lejour de la semainegfiruemmcole`eodemslaned
unevariablequalitative.Cettevariablen’estpastransform´ee.
Lesjours fe´rie´ssous forme de variable binaire. Cette variable n’est passont pris en compte
transform´ee.
Danscertainscas,l’effetdesvacancesdoite´galementeˆtreprisencomptedanslemod`ele
(parexemple,lorsquelavariablesanitaire´etudie´eestlenombred’hospitalisationscarl’acti-
vite´ des hoˆ pitaux est influence´e par ce facteur). La variable qualitativetype vacancessera alors
introduitesanstransformationdanslemode`le(lestypessont:no¨el,f´evrier,pˆaques,´ete´,tous-
saint).
Les´epid´emiesdegrippeontunimpactsurlesdonn´eesdesante´,quel’onqualifiede«li-
mite´»a`«majeur»erpdeio´ed’d´pissuAop,ihcrueuqauviruscirculant.lenoel´sretopydes,meei
´
une variablegrippeevuiqdiimien´dd’eris-aalcdsutrite´merseppd,epiis´neieastondaese´eetcr´
ract´eris´eespardesvirusdetypesdiffe´rents.Cesvariablesprennentlavaleur0,endehorsde
laperioded’´epide´mieetlesvaleursde1`antlanndpe,ceave´emipedide´’irdopae´nur´e,dede
´
l’e´pisode grippal exprim´ en jours. Les variablesgrippeapparaissent sous forme deB-splines
e
a`3degr´esdelibert´e,permettantainsideprendreencomptelavariabilit´einter-´epid´emiedans
l’intensit´eetladynamiquedeseffetssanitairesdus`alagrippe.
Lesvariablesm´ete´orologiquesprisesencomptedansl’analysesontlestempe´ratures mini-
malesetmaximalesbliaarsvesedrge´eCclui.seCnuesexprim´eesenavsebaircselitnoes.Ctdon

Journal de la Socie´te´ Franc¸aise de Statistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
92,00naecedrFqieuatemh´ateMt´´ecioSteeuqitsitatSenc¸aised´et´eFracoSic

38

Air et sante´ : utilisation des se´ries chronologiques

apparaissent sous forme denatural-splinesrtbe.L´eematerp´a`ged3se´riledr-tarumexamilajeuo
nali`ereestaffecte´ed’unretarddeunjour,tandisquelatemp´eratureminimalen’estpasd´ecal´ee.
Eneffet,uncertainnombred’´etudesontmontre´quelesfortestempe´raturesavaientuneffet
i´diatsurlasante´,alorsquelesfaiblestempe´raturesavaientuneffetd´ecal´edansletemps
mme
[3].Latemp´eratureminimale,observe´eenge´ne´rallanuit,traduitmieuxl’effetdesfortescha-
leursestivalescar,pendantl’´et´e,lespersonnesseprot`egentlejourdesplusfortestemp´eratures
mais ouvrent leur fe ˆtre la nuit. La tempe´rature maximale traduit quant a` elle mieux l’impact
ne
des jours froids car, en pe´riode de grands froids, les gens restent confine´s la nuit et ne sont ex-
pose´sauxconditionsme´te´orologiquesqu’aucoursdeleursde´placementsdiurnes.L’humidit´eet
lapressionatmosphe´riquesnesonthabituellementpasinte´gr´eesdanslemode`lecarleurpriseen
compten’apportepasd’informationsupple´mentaireparrapport`acelled´ej`aint´egr´eeaumode`le
au travers des variables temperatures minimales et maximales.
´
Parfois,lesp´eriodesdepollinisationpeuvent´egalementeˆtreprisesencompte,enparticulier
lorsquel’e´v´enementsanitairee´tudie´estunindicateurdepathologierespiratoire.Danscecas,les
comptesjournaliersdesgrainsdepollenspourlestaxonspertinents(posse´dantdespropri´et´es
allergisantes)sontse´lectionne´sselonlazonee´tudie´eetinclusdanslemod`elesousformed’une
variable sans transformation.
Lepolluantutseavenbairocelinntexueimpree´enµg/m3teeriaeacsrnofeeftestsuppos´elin´
sansseuil.Ilapparaıˆtsousformed’untermelin´eaire´egal`alamoyennedesniveauxdepolluant
dujourmˆemeetdelaveille.Cede´calageests´electio´riori. En effet, l’attitude classique,
nnea p
abandonne´e`apr´esent,consistait`atesterunensembleded´ecalages(de0`a5jours)maisceci
augmentaitl’erreurdepremi`ereespe`ceassocie´e`alar´ealisationdetestsmultiples.Lechoixde
ced´ecalage,supposantdeseffetssimilairesdesniveauxdepolluantslejouretlaveilledud´ece`s
sur le risque de de´ce`s, est par ailleurs biologiquement vraisemblable, et le plus fre´quemment
e´tudi´edanslalitte´rature.
Ci-dessous(Tableau1)figurentlesvariablesdumod`eleetleurtransformation.

3.2Sourcedesdonn´eesete´laborationdesindicateurs
Les donne´es concernant les niveaux de polluants sont fournies par les Associations agreees
´ ´
de surveillance de la qualite de l’air (Aasqa). Pour reconstruire l’exposition de la population
´
a`lapollutionatmosph´eriqueambiante,l’hypothe`seded´epartestquelesmesuresenregistr´ees
par l’Aasqa sont une estimation non biaise´e de la moyenne des valeurs individuelles de l’ex-
position des individus composant la population d’e´tude [34]. Dans la pratique, cette hypothe`se
setraduitparl’utilisationdelamoyennearithme´tiquedesvaleursjournali`eresenregistre´espar
diff´erentesstationsdemesuresitu´eessurlazonege´ographiquee´tudie´e(lesvaleursjournalie`res
d’unestatione´tant,elles-mˆemes,lesmoyennesdes24mesureshorairesenregistre´esparlasta-
tion).Cettemoyenneconstituel’indicateurd’expositionambiantequi,chaquejour,estattribu´e
` l’ mble de la population. Le calcul de cette moyenne est d’autant plus licite que les ni-
a ense
veauxdepollutionenregistr´esparl’ensembledesstationsdemesuresonthomogenesdansle
`
tempsetdansl’espace[19,18].Ainsi,lorsqu’onconside`redeuxs´eriesdemesuredupolluant,
le percentile75tnlierauperceup´erieueˆtisertu’leodend25de l’autre et la diffe´rence entre les
moyennes ne doit pas exce´der15µg/m3sxueiresceeofificnedtceror´elation,pourde;,lusplde
´
donne´es,doitˆetresup´erieur`a0,6[15, 4, 50].

JournaldelaSocie´t´eFranc¸aisedeStatistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
e´icFe´toSciqstetueciSot´´ecnarsia¸SedeitatFrance,2009Meta´hmetaqieued

Eilstein et al.

TALBUEA1 –ormaansfe,traturga.ecelate´ditnobliaduesarVitinn,la`domiele
Variable Nature Transformation De´calage(jours)
variable sanitaire(a)n-erie´ep´hmenratilego´rteidcs
tempsdiscre´tep-spline-

jour de la semainequalitative

joursf´eri´e
vacances scolaires

grippe

binaire

qualitative
dis `te
cre

tempe´rature minimalecontinue
tempe´rature maximalecontinue
compte polliniquecontinue

aucune

aucune

aucune

B-spline

n-spline

n-spline

aucune

0

0

0

0

0

1

0

polluantcontinue aucune 0-1
(a) En fait c’est l’espe´rance de la variable nombre de cas incidents
quiapparaıˆtdanslemode`le.

39

Lenombreded´ec`esestfourniparleCentred’´epid´emiologiesurlescausesm´edicalesde
de´c`es(Ce´piDC(Inserm)).
Lespe´riodesd’´epid´emiegrippalesontfourniesparlacoordinationnationaledesGroupes
re´gionauxd’observationdelagrippe(Grog).Cesp´eriodesd’´epid´emiessontde´finiesaumoyen
dedonneesd’activit´eenm´edecinedeville(consultationspoursyndromegrippal)etdedonn´ees
´
virologiques(validationdelapr´esenceduvirusdelagrippedanslespr´ele`vementseffectu´essur
lespatientspartestrapideouanalysedansuncentreder´ef´erence).
Lesdonn´eesm´et´eorologiquesproviennentdeMe´t´eoFrance.
Enfin,lescomptespolliniquessontfournisparleRe´seaunationaldesurveillancea´erobiologique
(RNSA).

3.3 Les outils de l’analyse
`
Achaquee´tapedel’´elaborationdumod`ele,unensembled’outils(analysedesr´esidus,com-
paraisondess´eriesobserve´eetpr´editeparlemod`ele)estutilise´afinded´eterminerlastructure
dumode`lelamieuxadapt´eeauxdonnees.
´

JournaldelaSocie´t´eFranc¸aisedeStatistique,150(1), 30-53,
http://smf.emath.fr/Publications/JSFdS/
coctSeti´Ma´e´ethedestatSitsieeuq2009amituqdeFearcn,e¸ciarFnatee´co´iS