ÉTUDE LONGITUDINALE DU DÉVELOPPEMENT DES ENFANTS DU QUÉBEC – Phase II (ÉLDEQ 2003-2010) Étude sur l’avenir d’une génération Guide de l’utilisateur de la de la banque de données du volet 2005 Enfants de 80 à 92 mois Direction Santé Québec Institut de la statistique du Québec Septembre 2006 ’’’’’’’ La documentation qui suit présente l’information nécessaire à l’utilisation des données du volet 2005 de l'Étude longitudinale du développement des enfants du Québec (ÉLDEQ). Ce document, divisé en cinq sections, présente d’abord un bref aperçu de l’enquête. La deuxième section traite de la convention de désignation des variables présentes dans la banque de données. La structure des fichiers et le contenu de chacun des fichiers sont les thèmes abordés aux sections 3 et 4. Finalement, les remarques et mises en garde sont présentées à la section 5. 11 - Population cible et collecte : Un bref rappel Au volet 2005, des informations ont été recueillies, entre les mois de mars et juin 2005, pour 2 31 537 enfants (âgés entre 80 et 92 mois) . Rappelons qu’à partir du volet 2004, pour être 4intégré à la banque de données, au moins un instrument de collecte doit être complété . 5La banque de données du volet 2005 inclut les informations tirées des instruments suivants : Questionnaire informatique rempli par l'intervieweure (QIRI) : • Sociodémographique; • Parent habitant dans le ...
ÉTUDE LONGITUDINALE DU DÉVELOPPEMENT DES ENFANTS DU QUÉBEC Phase II (ÉLDEQ 2003-2010)
Étude sur l avenir dune génération Guide de lutilisateur de la banque de données du volet 2005 Enfantsde80à92mois Direction Santé Québec Institut de la statistique du Québec Septembre 2006
La documentation qui suit présente linformation nécessaire à lutilisation des données du volet 2005 de l'Étude longitudinale du développement des enfants du Québec (ÉLDEQ). Ce document, divisé en cinq sections, présente dabord un bref aperçu de lenquête. La deuxième section traite de la convention de désignation des variables présentes dans la banque de données. La structure des fichiers et le contenu de chacun des fichiers sont les thèmes abordés aux sections 3 et 4. Finalement, les remarques et mises en garde sont présentées à la section 5.
1 - Population cible et collecte : Un bref rappel 1 Au volet 2005, des informations ont été recueillies, entre les mois de mars et juin 2005, pour 1 537 2 enfants (âgés entre 80 et 92 mois) 3 . Rappelons quà partir du volet 2004, pour être intégré à la banque de données, au moins un instrument de collecte doit être complété 4 . La banque de données du volet 2005 inclut les informations tirées des instruments suivants 5 : Questionnaire informatique rempli par l'intervieweure (QIRI) : • Sociodémographique;• Parent habitant dans le ménage; • Parent biologique absent; • Enfant; Questionnaire autoadministré de la mère (QAAM); Questionnaire papier administré à lenfant (QPAE); Questionnaire autoadministré de lenseignant/e (QAAENS); Questionnaire à compléter par l'intervieweure (QCI); Activité sur la connaissance des nombres; Activité « Je lis, je dis, je fais » (K-ABC). Il est à noter que le QIRI a été administré majoritairement en face à face 6 , tandis que le QAAM a été remis aux répondantes par voie postale. Le QPAE ainsi que lévaluation des capacités cognitives des enfants ont, pour leur part, été complétés en milieu scolaire ou à la maison 7 , selon le choix des parents. Quant au QAAENS, il a été remis à lenseignant/e lors de lentrevue avec lenfant en milieu scolaire ou posté lorsque celle-ci à eu lieu à la maison.
1 Pour obtenir plus de détails concernant la population, léchantillon, les différents instruments de collecte, ainsi que sur le processus de collecte, consulter le numéro 1 des volumes 1 et 2 de la collection ÉLDEQ disponible sur le site web de « Je suis, je serai », à ladresse suivante : www.jesuisjeserai.stat.gouv.qc.ca sous longlet « Documentation technique ». 2 Des informations ont été recueillies pour 1 538 enfants, cependant un répondant a dû être rejeté. 3 Rappelons que les changements apportés au calendrier de collecte en 2002 ont eu un effet sur lâge des enfants. Pour plus de détail, voir le document « Les effets du nouveau calendrier de collecte de données de lÉLDEQ sur la validité des mesures et la validité générale de létude » à la même adresse. 4 Par exemple, au volet 2005, 9 ménages nont pas complété de QIRI. 5 Tous les instruments de collecte (à lexception des jeux) sont disponibles sur le site web de « Je suis, je serai » à la même adresse. 6 Seuls 164 (11%) QIRI ont été administrés par téléphone, dont 41 familles résidaient hors Québec ou en régions éloignées. 7 La majorité des enfants ont été vus en milieu scolaire. Seuls 447 (30%) enfants ont été rencontrés à la maison. 2
2 - Convention de désignation des variables Pour désigner et retrouver facilement chacune des variables des différents fichiers de données, nous avons conçu une nomenclature qui sappuie en grande partie sur celle utilisée pour lEnquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) de Statistique Canada, que nous avons adaptée pour lÉLDEQ. Toutes les variables contenues dans la banque de données ont au plus huit caractères. Les noms des variables se présentent ainsi: H SE C Q nnx où: H se rapporte au volet de l'étude. Ainsi, « A » correspond au volet 1998 (5 mois) ; B correspond au volet 1999 (17 mois) ; « » C » correspond au volet 2000 (29 mois) ; « « D » correspond au volet 2001 (41 mois) ; « E » correspondau volet 2002 (44 à 56 mois) ; « F » correspondau volet 2003 (56 à 68 mois) ; « G » correspondau volet 2004 (68 à 80 mois) ; « H » correspond au volet 2005 (80 à 92 mois).
SE : se rapporte à une section du questionnaire informatisé (QIRI) ou à un questionnaire papier (voir le tableau 1). C correspond à la personne à laquelle la variable se rapporte. Ainsi, « E » signifie que la variable se rapporte à l'enfant ; « R » signifie que la variable se rapporte à la fratrie ; « M » signifie que la variable se rapporte à la mère/conjointe présente ; « J » signifie que la variable se rapporte au père/conjoint présent ; « F » signifie que la variable se rapporte au ménage ; « A » signifie que la variable se rapporte au père biologique absent du ménage ; « I » signifie que la variable se rapporte à lenseignant/e de lenfant cible ; « C » signifieque la variable se rapporte au meilleur ami de lenfant cible. Q se rapporte au genre de variable. Ainsi, « Q » signifie que la variable se rapporte à une question qui a été posée directement dans l'un des questionnaires ; « S » signifie que la variable représente une note calculée pour une échelle utilisée dans le questionnaire ; « D » signifie que la variable a été calculée à partir d'autres questions qui ont été posées dans le questionnaire ; « T » signifieque la note calculée pour une échelle utilisée dans le questionnaire a été standardisée, cest-à-dire ramenée à une valeur se situant entre 0 et 10;
3
« L » signifie que la note calculée pour une échelle à un volet donnée est basée uniquement sur les items longitudinaux, cest-à-dire ceux communs à tous les volets; « M » signifie qu'il s'agit d'une information de type date (en mois) ; « A » signifie qu'il s'agit d'une information de type date (en année). nnx : se rapporte à l'identification de la question. De façon générale, nn est un numéro séquentiel attribué à la variable et x est un indicateur alphabétique séquentiel pour une série de variables similaires. ATTENTION : Dans certains cas, les trois derniers caractères de la variable ne sont pas suffisants pour identifier correctement une question (p. ex. : questions permettant plus d'un choix de réponse). Dans de tels cas, les quatre derniers caractères ont alors été utilisés afin d'identifier la variable (le plus souvent en supprimant la lettre Q ). « » Particularité pour la section REL du questionnaire sociodémographique sur les liens unissant les membres du ménage entre eux Pour bien représenter ces relations, les variables sont définies comme ceci: H RE I Q J , où : H = volet de l'étude (2005) ; RE = indique la section RELATION du questionnaire QIRI, section Sociodémographique ; I = indiquela première personne définie par cette relation i = 1,2,...,15 ; Q = comme la convention ; J = indique la deuxième personne définie par cette relation j = 1,2,...,15 . Par exemple, HRE1Q2 indique la relation entre la 1 re personne (mère) et la 2 e personne (enfant cible) du ménage. Dans cette section, on demande les relations inter personnes seulement pour i < j. 3 - La structure des fichiers Lensemble des questions posées durant la collecte se retrouvent dans la base de données, exception faite des variables permettant didentifier un ou plusieurs membres du ménage, et la grande majorité des variables ont fait lobjet de validation 8 . Les variables sont classées dans différents fichiers selon la personne quelles concernent. Afin de faciliter lutilisation de la banque de données, les quelques lignes qui suivent présentent la structure des fichiers contenus dans la banque de données du volet 2005.
8 Pour de plus amples renseignements concernant les méthodes de validation utilisées voir : no 12, volume 2, section II de la collection ÉLDEQ. 4
Celle-ci est en grande partie la même que celle des volets précédents 9 . La banque de données de E8 contient les 13 fichiers suivants: SOCIO801 - contient 1 528 lignes et comprend les données concernant les membres du ménage); MERE801 - contient 1 510 lignes et comprend les données concernant la mère biologique ou la conjointe vivant dans le ménage; PERE801 - contient 1 298 lignes et comprend les données concernant le père biologique ou le conjoint vivant dans le ménage; PCM801 - contient 1 528 lignes et comprend les données concernant la PCM (personne qui connaît le mieux lenfant); ENFAN801 - contient 1 528 lignes et comprend les données concernant lenfant cible; BIO801 - contient 244 lignes et comprend les données concernant le père biologique non résidant; QAAM801 - contient 1 325 lignes et comprend les données concernant la mère biologique ou la conjointe résidant dans le ménage enquêté et ayant répondu au QAAM; QPAE801 - contient 1 489 lignes et comprend les données concernant lenfant ayant répondu au QPAE ; QAAENS801 - contient 1 312 lignes et comprend les données concernant lenseignant/e ayant répondu au QAAENS; QCI801 - contient 1 489 lignes et comprend les données concernant le comportement de lenfant cible pendant les tâches; JEUX801 - contient 1 484 lignes et comprend les données provenant des résultats de lenfant cible aux activités sur les nombres et à lactivité « Je lis, je dis, je fais » (K-ABC); INDI801 - contient 1 528 lignes et comprend les variables dérivées crées à laide des QIRI et QAAM construites par la DSQ et les partenaires de lÉLDEQ. INDI811 - contient 1 491 lignes et comprend les variables dérivées crées à laide des questionnaires QPAE et QAAENS. Ces variables sont construites par les partenaires de lÉLDEQ.
La banque de données contient également un fichier renfermant les pondérations associées aux différents instruments administrés aux parents (POIDS801), ainsi quun fichier intégrant les pondérations concernant les divers instruments administrés aux enfants et à leur enseignant (POIDS811). Pour plus de détails concernant la composition des fichiers de la banque de données du volet 2005, se référer au tableau 1. Un coup d'il à ce tableau permet de savoir dans quel fichier se trouve la variable ou la série de variables dintérêt. Dansuneoptiquelongitudinale,ilestconsei l édeseréférerauxquestionnairesdechacundesvoletspoursassurerdelacomparabilitédesquestionsdansletemps(disponiblessurlesitedelÉLDEQ:www.jesuisjeserai.stat.gouv.qc.ca souslonglet«Outilsdeco l ecte») .Eneffet,certaines9 Il est à noter que, contrairement aux volets précédents, le questionnaire papier autoadministré au père ne fait pas parti des instruments de collecte, et ce afin de diminuer la charge des répondants. 5
questionsouchoixderéponsepeuventavoirétémodifiés,inversésousupprimésdunvoletàlautre.Comme pour les volets précédents, chacun des fichiers contient une variable nommée IDME (numéro de ménage) qui doit absolument être utilisée lors de la fusion de fichiers. Tous les fichiers sont constitués d'une ligne par sujet ou ménage. Par exemple, les fichiers ENFAN801 et PCM801 contiennent 1 528 lignes, alors que le fichier MERE801 contient 1 510 lignes et le fichier PERE801, 1 298 lignes. La majorité des fichiers contenant des données du QIRI incluent aussi une variable qui indique le numéro didentification de la personne ayant répondu à chacune des composantes (HRP... ou HPC...). De même, la plupart des fichiers contiennent aussi une variable (HCA ou HCB) qui indique le numéro didentification de la personne qui est concernée par les questions. Ces variables peuvent être utiles lorsqu'on veut s'assurer qu'il s'agit bien, par exemple, du même répondant ou du même conjoint à travers les années ou dun fichier à lautre pour une même année (voir le tableau 2 pour connaître les variables qui identifient le répondant ainsi que la personne concernée pour chacun des instruments). De plus, depuis le volet 2001, des variables qui indiquent le statut de présence à chacun des temps précédents ont été ajoutées : hlgmd01 à 07 pour la mère (fichier MERE801), hlgjd01 à 07 pour le père (fichier PERE801) et hlgfd01 à 07 pour la PCM (fichier PCM801). Lasection quatre décrit de façon plus détaillée ces variables.
Finalement, tous les fichiers ont été développés avec le logiciel SAS. Chacun de ces fichiers est fourni en format SPSS WINDOWS (.sav) et en format SAS (9.1.3).
6
Tableau 1 Compositiondesfichiers 1 delabanquededonnéesduvolet2005delÉLDEQ,enfantsde80à92mois UESTIONNAIRES ET LETTRES SECTIONS 2 INDI UANT LA SECTION DU IRI OU LE UESTION-NAIRE PAPIER 3 QIRI SOCIODEMO
LFS( activitéprofessionne l e ) LF 1. À lexception du fichier des pondérations POIDS801 et POIDS811 (voir le contenu de ces fichiers à la section 4 du présent document). 2. Les noms de sections du QIRI sont ceux utilisés dans la version originale (anglaise) du questionnaire de lELNEJ. 3. Ces lettres se retrouvent à la 2 e et 3 e colonne du nom des variables. 4. Pour des raisons de confidentialité, les renseignements sociodémographiques de la section SOC du QIRI-parent (ex. : pays de naissance, origine ethnique, etc.) qui sont recueillis uniquement pour les nouveaux membres (parents biologiques ou nouveaux conjoints qui ne vivaient pas dans le ménage au volet précédent), ont été omis des fichiers MERE et PERE et sont utilisés uniquement pour la mise à jour des variables dérivées (fichier INDI801).
7
UESTIONNAIRES ET SECTIONS LETTRES (suite) INDI UANT LA SECTION DU IRI OU LE UESTION-NAIRE PAPIER
QIRI ENFANT
ACTIVITÉ « Je lis e dis e fais » (K-ABC) JK Source : Institut de la statistique du Québec, ÉLDEQ 1998-2005.
8
Tableau 2 Variablesidentifiantlapersonnerépondanteetlapersonneconcernéeparlinstrument,lequestionnaireoulasectionduquestionnaireinclusdanslabanquededonnéesduvolet2005delÉLDEQ VARIABLE DÉSIGNANT LE/LA VARIABLE DÉSIGNANT LE NUMÉRO INSTRUMENT ET QUESTIONNAIRE FICHIER RÉPONDANT/E DE LA PERSONNE CONCERNÉE PAR LA SECTION OU LE UESTIONNAIRE QIRI SOCIODEMO
JEUX ACTIVITÉ SUR LES NOMBRES, K-ABC JEUX801 (rempli par lintervieweur) 1. À noter que la personne qui répond peut ne pas être la PCM déclarée. Par exemple, au volet 2005, pour 4 familles, la PCM déclarée était la mère, alors que cest le père qui a répondu aux questions sadressant à la PCM dans le QIRI. Source:InstitutdelastatistiqueduQuébec,ÉLDEQ2003-2010.
9
4 - Contenu des fichiers Fichier SOCIO801 Ce fichier constitué de 1 528 lignes contient les variables sociodémographiques du QIRI (sections CONT, DEM, REL et HHLD), soit lâge, le sexe des membres du ménage, le statut de lunion du/de la PCM, les liens unissant les membres du ménage entre eux, lexistence dautres enfants du/de la PCM et/ou du/de la conjoint/e ne résidant pas dans le ménage et le statut de propriété résidentielle du ménage. À noter que les variables de la section REL (lien unissant les personnes entre elles), en raison de la complexité de sa structure, ont une notation quelque peu différentes de celle utilisée pour les autres variables (voir la section 2 « Convention de désignation des variables » pour plus de détails). Particularité : Dans la section REL, on demande les relations entre les personnes seulement pour la première personne définie par cette relation. Par exemple, on sintéresse à la relation (HRE1Q2) entre la mère (personne #1) et lenfant cible (personne #2) mais on ne demande pas la relation (HRE2Q1) entre lenfant cible et la mère; le programme informatique attribue de façon automatique la relation inverse. Notons que la 1 re personne est dans la quasi totalité des cas la mère biologique 10 , la 2 e personne est toujours lenfant cible et la 3 e personne est presque toujours le père biologique 11 .
Fichier MERE801 Ce fichier composé de 1 510 lignes contient les variables construites à partir des questions du QIRI concernant la mère biologique ou la conjointe vivant dans le ménage. À noter que la section INC ainsi que la question EDA-Q9 de la section EDA sont incluses dans le fichier PCM801 parce quelle concerne le ménage et non pas directement la mère. Comme par le passé, nous avons inclus dans le fichier MERE801 des variables indiquant le statut de présence de la mère enquêtée au temps 8 à chacun des temps précédents, soit du temps 7 au temps 1 (hlgmd01 à hlgmd07). Les données manquantes pour ces variables représentent les ménages nayant pas participé au volet concerné.
10 Dans le cas des deux enfants placés en famille daccueil avant le premier passage de lÉLDEQ (volet 1998 enfants âgés de 5 mois), les mères de ces familles daccueil ont été placées en première position. 11 Tous les conjoints (beau-père de lenfant cible) ayant intégré le ménage après le volet 1998 occupent une position dont le numéro peut varier de 4 à 12. Sils étaient présents au premier volet, ils ont été placés en troisième position.
10
Fichier PERE801 Les données de ce fichier proviennent du questionnaire parent (père/conjoint) du QIRI 12 (n = 1 298) . Afin de faciliter le suivi longitudinal, nous avons inclus dans ce fichier des variables indiquant le statut de présence du père enquêté au temps 8 à chacun des temps précédents, soit du temps 7 au temps 1 (hlgjd01 à hlgjd07). Les données manquantes pour ces variables représentent les ménages nayant pas participé au volet concerné. Fichier PCM801 Les données contenues dans ce fichier contenant 1 528 lignes, proviennent des sections du questionnaire parent (QIRI) sadressant spécifiquement à la PCM, soit dans la grande majorité des cas, la mère biologique de lenfant cible. Comme dans les fichiers MERE801 et PERE801, nous avons inclus dans ce fichier des variables indiquant le statut de présence de la PCM enquêtée au temps 8 à chacun des temps précédents, soit du temps 7 au temps 1 (hlgfd01 à hlgfd07). Les données manquantes pour ces variables représentent les ménages nayant pas participé au volet concerné.
Fichier ENFAN801 Ce fichier contient les variables provenant des sections du questionnaire « enfant cible » (n = 1 528) du QIRI. À noter que les questions concernant la taille et le poids de lenfant se trouvent dans le fichier QPAE801 puisque ces mesures ont été récoltées à laide du QPAE. Fichier BIO801 Ce fichier contient certains renseignements sociodémographiques portant sur le père biologique non résidant recueillis auprès de la répondante (n = 244) 13 . Ces informations sont colligées à laide du questionnaire « Parent biologique absent » du QIRI mis au point spécifiquement aux fins de la présente étude 14 . En raison des faibles taux de réponse obtenus, aucune pondération na été calculée et les données ne peuvent être utilisées quà titre indicatif seulement.
Fichier QAAM801 Recueillies à laide du QAAM, ce fichier contient les variables portant sur les mères (biologiques ou non) résidant dans le ménage enquêté (n = 1 325). 12 Dans 6 cas, le questionnaire « Parent » du conjoint na pu être généré parce que ceux-ci ont été déclarés comme « personne non apparentée » dans la « Grille des liens entre les membres du ménage » (section REL; idme = 5408, 5554, 5977, 6054, 7847 et 7802). Aucun renseignement tiré du QIRI-parent nest donc disponible pour ces derniers. 1 3 Sont exclus de ce fichier les pères biologiques pour lesquels on ne dispose daucune information. Afin de diminuer les désagréments vécus par les répondants/es face aux questions concernant leur ex-conjoint/e, la possibilité de refuser la création de ce questionnaire à été accrue. 14 À lorigine, le fichier contient également des renseignements sur les mères non résidantes. Toutefois, cette information est omise du fichier de données distribuées BIO801 en raison du trop petit nombre de mères non résidantes dans lenquête.