Les usages statistiques des nomenclatures : contraintes et exemples

De
Publié par

Dans l’activité quotidienne des statisticiens, les nomenclatures jouent un rôle indispensable. S’agissant précisément des nomenclatures d’activités et de produits, les usages pratiques dans les opérations statistiques sont nombreux, souvent implicites. En les soulignant, on pointe les raisons pour lesquelles, lors d’un changement de nomenclature, des adaptations et des évolutions sont nécessaires. En outre, le déploiement des nouvelles nomenclatures, ainsi que les nécessaires rétropolations et extrapolations, s’inscrivent dans un cadre réglementaire multiple et contraignant.
Publié le : dimanche 30 décembre 2012
Lecture(s) : 37
Tags :
Nombre de pages : 8
Voir plus Voir moins
Les usages statistiques des nomenclatures : contraintes et exemples
! Par Jean Lienhardt* Dans l’activité quotidienne des statisticiens, les nomenclatures jouent un rôle indispensable. S’agissant précisément des nomenclatures d’activités et de produits, les usages pratiques dans les opérations statistiques sont nombreux, souvent implicites. En les soulignant, on pointe les raisons pour lesquelles, lors d’un changement de nomenclature, des adaptations et des évolutions sont nécessaires. En outre, le déploiement des nouvelles nomenclatures, ainsi que les nécessaires rétropolations et extrapolations, s’inscrivent dans un cadre réglementaire multiple et contraignant.
Les nomenclatures d’activités et de produits entrent dans l’orga-nisation de base des sources sta -tistiques. On peut citer quelques exemples.
d’assurer la cohérence de ces échan-tillons.
Le code APE (activité principale exercée) peut uer le rôle d’un identifiant Les nomenclatures jdoans le domaine de la d’activités et de produits statistique d’entreprise sont utilisées dans la définition du champLe service statistique public est carac-des enquêtes et dese forte rdé indicateurs statistiquespintecn eneadcaited ssirétnu rap és oni qusoy  mnteéneC .stse Les différents règlements statistiquesExtrait de la couverture de la Nomenclatureen particulier le cas des opérations sectoriels européens ont recours à lad’activités et de produits française – NAFstatistiques concernant les entrepri-NACE pour arrêter leur champ dappli-screist.è rIel sf apuetr tidnoennct s pdoiudveonitri fidcéaftiinoirn  ddeess  cation. Le changement de référentiel, unités statistiques et des agrégats qui d’une version de la NAF à la suivante,Les nomenclatures sont a deux conséquences immédiates :utilisées dans la sélectionles regroupent. des échantillons   lune de ces conséquences est tÀio ncse t aésgsaorcdi,é edse  atouuxt eus nliteéss  insftoartimstai--technique ; il s’agit de la transposition Quand il s’agit de statistiques d’entre- ques dans les fichiers de données du règlement à champ constant ; prises, la NAF est le critère numéro un individuelles, le code APE est une – l’autre est politique ; c’est la négo- pour la plupart des échantillonnages des plus significatives. Il en est de ciation sur les extensions ou aban-stratifiés. Aussi, tous les répertoires gméês m:e  led acnsd ec eArtPaEin ss erfit chsioeursv enatg rdée- dons de champ induits par le chan- et outils de lancement d’enquêtes o gement.doivent-ils être immédiatement mis uprni nacgirpéagl iadt.e nUtnifeia vnat lipdoautir ounn se yssttréatme aotiu- aux normes d’une nouvelle nomen-En pratique, les ajustements de clature. Ceci concerne notamment que de ce code est donc recherchée champ des sources statistiques peu-le répertoire Sirene et les répertoires ldeasn sr élepse rtboairseess.  dCe edcio ndnééteesr meit nde anlas  vent se traduire par la création de associés, les fichiers de lancement nouvelles enquêtes ou par le maintien denquêtes et les bases de sondages. qenutarlité des échanges dinformati ocness  d’enquêtes existantes pour des rai- Le cha sons de continuité. site au nmgoeimnse lnat  dmei sreé fàé rneivnetiaelu  ndéec ceess- aégcrhéaegn faigtcesh s(i epiramsr  pselitxqaetuimestnpitlq eud iedrsae,nc ltsoe rlemssqe usntey sdteè-s Subsidiairement, on est conduit à outils de base. mes intermédiaires d’entreprises). redéfinir les champs de compétence de à, il avoir des consé-des divers opérateurs statistiques, Au- l peut y basés eux aussi sur les nomenclatu- quences méthodologiques délicates. res. Ceci implique des transferts de Dans le cas d’enquêtes continues, nateur* Jean Lienhardt est, à l’Insee, coo d compétence entre services statisti- qui appellent le renouvellement par-onrdon scnem-alau changement deset aravxul éi s ques ministériels (SSM). tiel d’échantillons, il convient en effettures d’activité.
Courrier des statistiques n° 125, novembre-décembre 2008
77
Jean Lienhardt
Le code APE est utilisé au sein des processus de production statistique de multiples manières, dans le « moteur » même des applications
Quelques exemples :
– dans l’EAE (enquête annuelle d’en-treprise), un code APE est construit à partir des données recueillies. Le changement de nomenclature néces-site d’établir un nouvel algorithme de construction de ce code ; – dans de nombreuses applications,  le code APE entre dans la définition des critères de qualité : représentati-vité minimum pour une strate de l’In-dice de la Production Industrielle (IPI), curseurs de qualité dans des opéra-tions de synthèse, critère quantitatif dans des opérations réglementées pour les statistiques structurelles. L’actualisation de la nomenclature conduit à ré-agencer les seuils et cri-tères de qualité ; – le code APE intervient de manière récurrente dans les questions de codage : soit directement s’il s’agit du libellé en clair de l’APE, soit indirecte-ment si l’APE est utilisée comme varia-ble annexe pour le codage d’autres variables (détermination de la PCS dans les enquêtes auprès des ména- ges). L’encadré sur « L’utilisation de la NAF dans le codage automatique » précise la portée de cet usage qui fait appel au logiciel Sicore. Le change-ment de nomenclatures impose natu-rellement une rénovation des fichiers associés (bases de connaissances), ce qui représente un volume de travail important.
Les nomenclatures sont un outil privilégié pour la diffusion des résultats et leur analyse
On ne peut évidemment pas se limiter à communiquer des fichiers de don-nées brutes. Ne serait-ce qu’en rai-son des règles du secret statistique. On est donc conduit à proposer des résultats selon les catégories de la nomenclature. C’est le rôle des appli-cations de diffusion de construire ces
78
Encadré 1 : l’utilisation de la NAF dans le codage automatique font intervenir des outils de codage des créations d’entreprises (puisque (transcription des déclarations en clair les libellés déclarés spontanément ne en des codes d’une nomenclature). sont pas ceux de la nomenclature). De leur côté, le RP et l’EEC utiliseront Deux variables sont usuellement des fichiers d’apprentissage similaires, concernées : constitués à l’été 2008. – l’APE (Activité Principale Exercée) S’agissant du codage de la profession : codée avec la NAF ; Sicore sert à coder les déclarations de la profession codée avec la PCS professions recueillies dans les enquê-(Professions et catégories sociopro- tes ou les Déclarations Annuelles de fessionnelles). Données Sociales (DADS). Sicore L’Insee a développé un logiciel de est utilisé, d’une part, dans la chaîne codage automatique Sicore d’usage de traitement en aval de la collecte (« grosses » enquêtes, fichiers adminis-général. Ce Système Informatique de tratifs). Il est aussi installé sur le micro-uCtiOlisdea gdee sd fei chRiéerpso ndsaesp pareunxt isEsnaqgueê tqeusi  ordinateur des enquêteurs (enquêtes légères). Les traitements automatiques contiennent des libellés en clair et les sont complétés par des traitements codes associés. Il recourt également confiés à des équipes spécialisées en tài odness  i«s svuaerisa bdleess  amnênemxeess  d»,o cinufmoremntas- région. qquuee sltai ovnanriaairbelse, .à.) . coCdeesr  (vliaarsiaseblse sS irfeancie-, Pour le RP, lEEC ou les enquêtes uti-lisant le Tronc commun des enquêtes litent l’attribution d’un code grâce à auprès des ménages (TCM), Sicore uti-des tables de décisions, ensembles de lise jusqu’à quatorze variables annexes, rbèleg leqsu loong ivqeuets  csopdécifiques à la varia-deux dentre elles étant construites sur u er. la NAF : La NAF étant utilisée – directement – l’APE au niveau le plus détaillé de la ou indirectement – dans ces opéra- nomenclature (EEC, RP) ;  tions de codage, les conséquences du – une variable NAF2 qui correspond chan eme ette nomenclature aux divisions de cette nomenclature sont igmporntta n tedse. c(disponible dans les enquêtes utilisant le TCM). S’agissant du codage de l’APE, les fichiers d’apprentissage doivent être Le changement de NAF impose donc adaptés aux intitulés et codes de la l’adaptation – et généralement la réé-nouvelle nomenclature. De tels fichiers criture – des tables de décision qui sont utilisés pour le répertoire Sirene, exploitent ces deux variables. le Recensement de la population (RP) L’Insee est également amené à trans-ou l’enquête emploi en continu (EEC). mettre des résultats dans la nomen-Début 2008, les fichiers d’apprentis- clature CITP/ISCO (cf. articles de sage de Sirene ont pris en compte les Cécile Brousse et de Jérémie Torterat). intitulés de la NAF rév.2. De nouveaux La table de passage PCS-CITP utilise codes ont été affectés aux libellés la NAF détaillée, la NAF2 et la taille déjà connus. Ces fichiers sont enrichis de l’entreprise. Elle a fait aussi l’objet tout au long de 2008 par les libellés d’une rénovation en 2008.
résultats. Bases de données et outils où les entreprises qui ont la même de fabrication des produits diffusés APE ont souvent des comportements doivent être calés sur les nouvel - économiques similaires. La NAF les références. Les règlementations et les nomenclatures de synthèse européennes font d’ailleurs obliga- (cf. l’article de Chantal Madinier) ont tion de diffuser dans ces nouvelles d’ailleurs été construites avec cet catégories. Cette contrainte vise à la objectif de décrire le fonctionnement comparabilité des résultats et à leur de l’économie de manière judicieuse. qualité. Dans ce domaine aussi, le chan -gement de nomenclatures fourmille Enfin, la variable APE est un critère d’implications directes quant au particulièrement pertinent de l’ana- regard que l’on peut avoir sur les faits lyse économique, dans la mesure économiques.
Les usages statistiques des nomenclatures : contraintes et exemples
La mise en œuvre statistique de la NACE rév. 2 :Encadré 2 : un cadre réglementaire multiple régit les nomenclatures et une opération complexeconditionne leur mise en œuvre nécessitant une structure de projetn.ssion atméesnlieué g  rarnetaêdt rcreC Lalimmouaev ed qieu sostmele entopurn ée tdbaro dudr gèaire découle tou n°1893/2006 du 20 décembre 2006 qui Changer de nomenclatures dansinstitue la nouvelle NACE. total, s’agissant de la NACE rév.2, Au un système statistique décentraliséeesd lsetsop sed etnemelgèr setxae t  lsd  tséupl-pd ansuial  qanlsd eao seriata Eété tns-tati eodotzrses amni comme le service statistique public tiques spécifiques. Ils définissent unNACE rév.2 elle-même, ce règlement  français n’est pas une affaire ano- presque complet d’une programmeinclut de nombreuses prescriptions dine. Cette opération a d’ailleurs été en œuvre coordonnée au niveau misegénérales qui en organisent la mise  jugée assez délicate pour justifier laen œuvre : date d’entrée en vigueur au européen. Ils laissent toutefois dans décision, dès juin 2004, de procéderseuqmod  eduleuqceinitrtlmotpbaeleu stec a-tistiqaines st1-18, e-200isnotxneitno sanoepstarl psrm,i  -,innasitp ed imocolot eigpour les futures à « l’analyse prospective des risquescapesulièrticnt lremeitats se seuqitsa-adrtipatgaoisn liés à la mise en œuvre des nomen-clatures d’activités et de produits de coles, les statistiques de la balanceD’autre part, le règlement révise expli-la génération 20071». stsenemglrèe nzo tnemeticquêts ene levoirtecur usjnnoa teiotctsseqdi  e.de paemei,stnsel moc esptat nnaio, ux sectoriels. Il fixe pour chaque domaine Le rapport de l’Inspection générale de Dansconcerné les principaux paramètres tous ces domaines, une régle-l’Insee, diffusé en février 2005, mettait mentation : spécifique est établie avecen place de la NACE rév.2de la mise l’accent sur quelques points essen-ucan orp .erpdnelreirlg-ePA Crè (ranccelae iuq noc uoP ec rinitnod  uhcma,plendrier, redéfineséitatd nor selruis écèsrta-tt de s,pre tiels en soulignant la nécessité : n° 415/2008 du 23 avril 2008), lecritères de conformité (qualité, seuils), ment éléments relatifs à la transition (points  – de participer activement auxenro à rèe emglt en bse).tion,sr buelopaltéordo : lmples si plue tsépneueorri etaenemglrèf tisiopsid travaux européens de mise à jour la CPA et à en définir les utili- établirCe cadre réglementaire a été complété des différents textes juridiques ren- générales. Les mesures d’ap-par un second train de mesures prises sations dus caducs par le changement delement n°973/2007 nomenclatures (particulièrement lesd ta ,neisnommsia Code lgèr ude drcae  lnsdad noortnicéd cédplicn seatiosell .tceseiroelc daersed na sussions  de disceud2  0oatû  nomenclatures de synthèse au niveau Notons2007. Ces mesures sont importantes que le règlement CPA offre international) ;car, dans les années récentes, de la possibilité d’extensions nationales, plus en plus de paramètres techni- mais la France a décidé de ne pas – d’inscrire le pilotage national du de cette option. profiterques majeurs des opérations statis-changement de nomenclatures dans le cadre des échéances européen-nes ; NACE rév.2 des statistiques structu- rév.1 à la NAF rév.2), il convient de relles relatives à 2008. D’une façon faire les deux remarques suivantes : – de renforcer la structure de coor- générale, la réglementation précise dination du projet « changement de ti es annue – le rythme d’exécution du pro-nomenclatures » et den documenter rqaupep loertse nstt aatiusx qacutivités écollneos mqiuqiu esse gramme de mise en place de la nou-le processus. réalisées en 2008 doivent être dis- veallties ntioqmueesn cldaetvurrae  dêatrnes  lsees nospibélreatmioennst  st Ces pistes ont servi de lignes directri- ponibles en nouvelle nomenclature. ra i ces à la mise en place progressive du rSelalegsis sdaentn trdeepsr issetsa ti(sStiSqEu),e sl a stFrruacntcue-(pdCluufr.s é ea rtdpiceld feea  bdqreui ceTanhti io1ern9r 9yd3 .Lu anOcenr  onaio xp)m uqe nnuocetl leaar-  nouveau système à partir de 20062. a anticipé d’une année et s’est mise ture au niveau international avait elle-En conséquence directe de ce en mesure de diffuser des premiers même été sensiblement raccourcie. cadrage, le calendrier national de la résultats en NAF rév.2 dès le 2ème Le petit tableau qui suit résume les mise en place de la NAF rév.2 s’ar- semestre 2008 pour l’exercice relatif deux échéances principales ;  ticule autour de quatre dates princi- à 2007 ; – mais une différence e l situa-pales : ntre a  mai 2011 : bl   6 janvier 2008 : basculement de velle base dep ucoicmaptitoens  dnea ltiao nnaouux- tion actuelle et celle qui prévalait en Sirene ; en NAF rév.2 (période de référence Opération1. L’Europe a retenu les termes « – premier trimestre 2009 : publication 2008-2010) ; ua erv mesuratœun  eislr seenés dneig » 7ruop002 nomenclments dec ah-negbmeld se tdeersm ep reen mNieArFs  riénvd2i c;ateurs de court Pour autant lon puisse comparer 1p2eh. rivnaj p érgatiemtnicés008.er 2l sIed e al saed ean dces art cltisen monelctaruse mise en œuvre d, que .  avec l’expérience de 1993 (le passagela phase de conception faisant l’objet des des-– octobre 2009 : transmission à de la NAP à la NAF était d’ampleurroutpe G et hiered s an dnsioptric eedT ihlraitlcroix ainerry Lac snaulecq isd euPhn-ipildei ea J Eurostat des premiers résultats en comparable au passage de la NAFJean-Paul Lachize.
Courrier des statistiques n° 125, novembre-décembre 2008
79
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.