Cet ouvrage fait partie de la bibliothèque YouScribe
Obtenez un accès à la bibliothèque pour le lire en ligne
En savoir plus

Problèmes de modélisation prévisionnelle : l'exemple de la croissance du taux de bacheliers - article ; n°2 ; vol.32, pg 241-261

De
24 pages
Revue française de sociologie - Année 1991 - Volume 32 - Numéro 2 - Pages 241-261
La validité de la prévision d'un fait social est subordonnée à la pertinence des hypothèses, en partie implicites, de la modélisation des comportements observés. Les études prévisionnelles du taux de bacheliers par génération se sont révélées, dans le passé, d'autant plus défaillantes qu'une vision quelque peu déterministe a prévalu sur la prise en compte du contexte spatio-temporel, que celui-ci soit appréhendé à un niveau institutionnel à partir des politiques éducatives ou au niveau de la rationalité coûts-bénéfices des demandeurs de formation. Le présent article montre, d'une part, l'indétermination mathématique de la prévision du taux de bacheliers par génération ; d'autre part, la pertinence limitée des hypothèses relatives à une modélisation logistique de ce taux. D'autres modélisations sont envisageables, sans que des justifications plus solides rendent ces prévisions plus fiables à long terme.
Patrick Mear, Pierre Merle : Problems with estimative modelization : as an example, the increasing percentage of French graduates at Вас level.
The validity of the estimate made for a social act is subject to the pertinence of the hypotheses, which are partly implicit, used to modelize observed behaviour. Estimative studies of graduate rates for each generation have, in the past, revealed themselves to be more untrustworthy as a some what less deterministic vision has prevailed over the realization of the spatiotemporal context, whether the latter is apprehended at an institutional level by means of educational policies or at the level of cost-benefit rationalness of those requesting training. This article shows, on the one hand, the mathematical indétermination of the estimate for the percentage of graduates per generation ; and on the other, the limited pertinence of hypothesis related to a logistic modelization of this percentage. Other modelizations can be envisaged without the more consistent justification making these estimates any more reliable in the long term.
Patrick Mear, Pierre Merle : Probleme der Prognosemodellisierung : das Beispiel der Steigerung der Abiturientenrate.
Die Gültigkeit der Prognose eines sozialen Tatbestands (fait social) unterliegt der Richtigkeit der Hypothesen, zum Teil implizit, zur Modellisierung der beobachteten Verhaltensweisen. Die Prognoseuntersuchungen der Abiturientenrate pro Generation waren in der Vergangenheit um so erfolgsloser als dazu eine etwas deterministische Betrachtungsweise vorherrschend war gegenuber der Berücksichtigung des raumzeitlichen Kontexts, ob dieser Kontext auf der institutionellen Ebene ausgehend von Erziehungspolitiken erfasst wurde, oder auf der Ebene der Rationalität Aufwand-Gewinn der Ausbildungsanwärter. Der vorliegende Aufsatz zeigt einerseits die mathematische Unbestimmtheit der Prognose der Abiturientenrate pro Generation und andererseits, die bedingte Richtigkeit der Hypothesen zur logistischen Modellisierung dieser Rate. Weitere Modellisierungen können ins Auge gefasst werden, ohne dass jedoch tiefgehendere Begründungen diese Prognosen langzeitig verlässlicher machen würden.
Patrick Mear, Pierre Merle : Problemas de modelización preventiva : el ejemplo de crecimiento del porcentaje de bachilleres.
La validez de la previsión de un hecho social esta subordinada a la pertinencia de las hipótesis, en parte implicitas, de la modelización de los comportamientos observados. Los estudios preventivos del indice de bachilleres por generación se han revelado en el pasado tanto más desfallecientes cuanto que una vision un poco determinista a prevalecido sobre la toma en cuenta del contexto espacio-temporal, que este sea considerado a nivel institucional a partir de unas politicas educativas о a nivel de la racionalidad costo-beneficio de los solicitadores de formación. El presente artículo demuestra de una parte la indeterminación matemática de la previsión del porcentaje de bachilleres por generación; por otra parte la pertinencia limitada de las hipótesis relativas a una modelización logística de este porcentaje. Otras modalizaciones son posibles sin que unas justificaciones más solidas hagan estas previsiones más fiables a largo plazo.
21 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Voir plus Voir moins

Patrick Mear
Monsieur Pierre Merle
Problèmes de modélisation prévisionnelle : l'exemple de la
croissance du taux de bacheliers
In: Revue française de sociologie. 1991, 32-2. pp. 241-261.
Citer ce document / Cite this document :
Mear Patrick, Merle Pierre. Problèmes de modélisation prévisionnelle : l'exemple de la croissance du taux de bacheliers. In:
Revue française de sociologie. 1991, 32-2. pp. 241-261.
http://www.persee.fr/web/revues/home/prescript/article/rfsoc_0035-2969_1991_num_32_2_4041Résumé
La validité de la prévision d'un fait social est subordonnée à la pertinence des hypothèses, en partie
implicites, de la modélisation des comportements observés. Les études prévisionnelles du taux de
bacheliers par génération se sont révélées, dans le passé, d'autant plus défaillantes qu'une vision
quelque peu déterministe a prévalu sur la prise en compte du contexte spatio-temporel, que celui-ci soit
appréhendé à un niveau institutionnel à partir des politiques éducatives ou au niveau de la rationalité
coûts-bénéfices des demandeurs de formation. Le présent article montre, d'une part, l'indétermination
mathématique de la prévision du taux de bacheliers par génération ; d'autre part, la pertinence limitée
des hypothèses relatives à une modélisation logistique de ce taux. D'autres modélisations sont
envisageables, sans que des justifications plus solides rendent ces prévisions plus fiables à long terme.
Abstract
Patrick Mear, Pierre Merle : Problems with estimative modelization : as an example, the increasing
percentage of French graduates at "Вас" level.
The validity of the estimate made for a social act is subject to the pertinence of the hypotheses, which
are partly implicit, used to modelize observed behaviour. Estimative studies of graduate rates for each
generation have, in the past, revealed themselves to be more untrustworthy as a some what less
deterministic vision has prevailed over the realization of the spatiotemporal context, whether the latter is
apprehended at an institutional level by means of educational policies or at the level of cost-benefit
rationalness of those requesting training. This article shows, on the one hand, the mathematical
indétermination of the estimate for the percentage of graduates per generation ; and on the other, the
limited pertinence of hypothesis related to a logistic modelization of this percentage. Other
modelizations can be envisaged without the more consistent justification making these estimates any
more reliable in the long term.
Zusammenfassung
Patrick Mear, Pierre Merle : Probleme der Prognosemodellisierung : das Beispiel der Steigerung der
Abiturientenrate.
Die Gültigkeit der Prognose eines sozialen Tatbestands (fait social) unterliegt der Richtigkeit der
Hypothesen, zum Teil implizit, zur Modellisierung der beobachteten Verhaltensweisen. Die
Prognoseuntersuchungen der Abiturientenrate pro Generation waren in der Vergangenheit um so
erfolgsloser als dazu eine etwas deterministische Betrachtungsweise vorherrschend war gegenuber der
Berücksichtigung des raumzeitlichen Kontexts, ob dieser Kontext auf der institutionellen Ebene
ausgehend von Erziehungspolitiken erfasst wurde, oder auf der Ebene der Rationalität Aufwand-
Gewinn der Ausbildungsanwärter. Der vorliegende Aufsatz zeigt einerseits die mathematische
Unbestimmtheit der Prognose der Abiturientenrate pro Generation und andererseits, die bedingte
Richtigkeit der Hypothesen zur logistischen Modellisierung dieser Rate. Weitere Modellisierungen
können ins Auge gefasst werden, ohne dass jedoch tiefgehendere Begründungen diese Prognosen
langzeitig verlässlicher machen würden.
Resumen
Patrick Mear, Pierre Merle : Problemas de modelización preventiva : el ejemplo de crecimiento del
porcentaje de bachilleres.
La validez de la previsión de un hecho social esta subordinada a la pertinencia de las hipótesis, en
parte implicitas, de la modelización de los comportamientos observados. Los estudios preventivos del
indice de bachilleres por generación se han revelado en el pasado tanto más desfallecientes cuanto
que una vision un poco determinista a prevalecido sobre la toma en cuenta del contexto espacio-
temporal, que este sea considerado a nivel institucional a partir de unas politicas educativas о a nivel
de la racionalidad costo-beneficio de los solicitadores de formación. El presente artículo demuestra de
una parte la indeterminación matemática de la previsión del porcentaje de bachilleres por generación;
por otra parte la pertinencia limitada de las hipótesis relativas a una modelización logística de esteporcentaje. Otras modalizaciones son posibles sin que unas justificaciones más solidas hagan estas
previsiones más fiables a largo plazo.R. franc, sociol., XXXII, 1991,241-261
Patrick MEAR, Pierre MERLE
Problèmes de modélisation prévisionnelle :
l'exemple de la croissance du taux de bacheliers
Résumé
La validité de la prévision d'un fait social est subordonnée à la pertinence des
hypothèses, en partie implicites, de la modélisation des comportements observés. Les
études prévisionnelles du taux de bacheliers par génération se sont révélées, dans le
passé, d'autant plus défaillantes qu'une vision quelque peu déterministe a prévalu sur
la prise en compte du contexte spatio-temporel, que celui-ci soit appréhendé à un
niveau institutionnel à partir des politiques éducatives ou au niveau de la rationalité
coûts-bénéfices des demandeurs de formation. Le présent article montre, d'une part,
l'indétermination mathématique de la prévision du taux de bacheliers par génération ;
d'autre part, la pertinence limitée des hypothèses relatives à une modélisation
logistique de ce taux. D'autres modélisations sont envisageables, sans que des justif
ications plus solides rendent ces prévisions plus fiables à long terme.
Plusieurs auteurs ont, dans un passé relativement récent, réalisé des
études prospectives sur le nombre ou le taux de bacheliers par génération.
Les méthodes mises en œuvre diffèrent souvent sensiblement et les résultats
sont généralement assez rapidement périmés. Les données statistiques
actuellement connues ne permettraient-elles donc pas une prévision fiable
de la croissance du taux de bacheliers par génération ?
La question posée, qui vaut autant pour la statistique sociale que pour
la prospective économique (Jeanneney, 1989), est celle de la validité de la
modélisation et de la prévision. Indirectement, il s'agit, à partir de l'étude
des prévisions du taux de bacheliers par génération, de s'interroger sur la
façon dont il faut, pour reprendre l'expression de Durkheim, « traiter les
faits sociaux scientifiquement» (Durkheim, éd. 1986, p. vu).
Chercher à modéliser mathématiquement un fait social, en établissant
les caractéristiques de la loi statistique qui peut en rendre compte et le
prévoir, constitue une démarche sociologique spécifique sous-tendue par
un certain nombre d'hypothèses généralement implicites (1). La présente
étude cherche à expliciter ces hypothèses et à les discuter.
(1) Sur «l'intervention de l'implicite» dans l'élaboration des idées fausses, cf. Boudon
(1990).
241 Revue française de sociologie
I. — Aléas de la prévision et prévision de l'aléa
Les aléas de la prévision
L'incertitude de la prévision est révélée par les erreurs des prévisions
passées et par l'existence de divergences quant au choix du modèle de
prévision à utiliser.
Prenons deux études relatives à la prévision du taux ou du nombre de
bacheliers par génération (2). P. Maes, sur un horizon de près de 25 ans
— de 1961 à 1985 — , avait fortement sous-estimé le taux de bacheliers :
le taux de 25 % qui n'aurait été atteint qu'en 1985 fut pratiquement celui
de 1974 (Maes, 1962) ! De même, en 1985, M. Cherkaoui considère
qu'« un chiffre voisin de 28 % ou 30 % constitue un seuil empirique vers
lequel tend le nombre d'élèves en terminale » (Cherkaoui, 1986, p. 24).
Cinq ans après, le taux de bacheliers par génération est supérieur au seuil
envisagé de plus de 10 points.
Le désaccord des auteurs concerne également le choix des modèles à
utiliser, même lorsque les études parviennent à des prévisions semblables.
Citons deux résultats qui laissent envisager comme probable que près de
40 % d'une génération serait titulaire du baccalauréat en l'an 2 000. Ces
résultats sont obtenus par des modélisations différentes. Ainsi, J.-C.
Chesnais (1975) obtient ce résultat par extrapolation linéaire de la ten
dance observée de 1958 à 1973. P. Cibois et J.-J. Droesbeke (1988),
procédant différemment, opèrent un ajustement des taux de bacheliers de
1920 à 1987 à une fonction logistique. L'accord à moyen terme, à l'horizon
2 000, cache un désaccord croissant pour les années postérieures à cette
date. Pour P. Cibois et J.-J. Droesbeke, le taux de bacheliers par génération
ne devrait pas dépasser à terme 45 %, alors que pour J.-C. Chesnais une
telle limite, en raison du choix de la méthode utilisée, ne peut pas être
envisagée.
La sous-estimation constante des prévisions et les divergences de
méthodes généralement employées (extrapolation linéaire ou ajustement
logistique) amènent à poser deux questions :
— la prévision, qui s'est avérée jusque-là si décevante, ne peut-elle pas
intégrer la prévision de l'aléa ?
— existe-t-il un modèle de prévision fiable à moyen et long terme ?
(2) L'utilisation ici du terme de « prévi- des prévisions. La distinction entre les deux
sion » est discutable. Dans certaines études, termes n'interdit pas, de toute façon, une
une distinction est établie entre prévision et confrontation des projections aux évolutions
projection, comprise comme « schéma d'in- ultérieurement constatées et une interroga-
telligibilité ». Toutefois, cette distinction tion sur les écarts éventuellement observés et
n'est pas toujours retenue : les projections les schémas d'intelligibilité qui ont été propo-
quantitatives sont également appréhendées, ses (Dubois, 1985).
dans les discours commun et savant, comme
242 Patrick Mear, Pierre Merle
Prévision de l'aléa
Des deux modèles de prévision précédemment présentés le deuxième
modèle est a priori le plus satisfaisant.
Une telle modélisation logistique a été proposée en 1982 par
M. Cherkaoui dans son étude sur Les changements du système éducatif en
France. 1950-1980. Plusieurs justifications empiriques sont possibles :
l'évolution des taux de scolarisation en France, lorsqu'ils ont atteint un
plafond, correspond approximativement au tracé d'une courbe logistique;
l'obtention d'un diplôme peut être assimilée à l'acquisition d'un bien
économique dont le modèle de diffusion est généralement bien représenté
par une courbe logistique. Ce modèle est, à long terme, le plus satisfaisant
a priori puisque les propriétés mathématiques de cette courbe imposent
une limite supérieure à l'accroissement du taux de bacheliers par génér
ation.
L'exemple étudié étant celui de l'évolution d'un taux — celui des
bacheliers — , le seuil de 100 % s'impose comme limite supérieure d'ac
croissement. Le modèle logistique est ici considéré en tant que modèle de
prévision quantitatif. Comme le montre R. Thom : « Si l'on veut qu'un
modèle soit pragmatiquement efficace, alors, nécessairement, ce modèle
contiendra une composante quantitative permettant la localisation spatio
temporelle des phénomènes qu'il décrit » (Thom, 1982).
Les hypothèses principales de construction d'une courbe logistique N(t)
sont les suivantes :
— le taux de bachelier N(t) est croissant,
— l'accroissement relatif du taux de N(t) décroît de façon linéaire avec
celui-ci.
Ces hypothèses conduisent à une équation différentielle :
dN/dt = c(l - N/a) N (3)
qui admet comme solution : N(t) = a/(l x exp(b — et)) (4)
où a, b, с sont des constantes.
La courbe est une courbe sigmoïde (en « S »). Les principales caractéris
tiques de N(t) sont les suivantes :
— la limite supérieure de N(t) est a qui constitue le seuil vers lequel N(t)
tend à long terme;
— la courbe est symétrique par rapport au point de coordonnées (b/c,
a/2), et ce point est un point d'inflexion de la courbe. La connaissance
de l'ordonnée du point d'inflexion (a/2) permet donc de connaître a,
c'est-à-dire la limite supérieure du phénomène étudié {Figure 1 ). Le point
(3) Le terme с (1 - N/a) est appelé par découverte de la fonction logistique lors de
certains auteurs « fonction de freinage ». ses études sur la loi d'accroissement des
(4) On doit à Pierre-François Verhulst la populations (Verhulst, 1845).
243 française de sociologie Revue
a -,
a/2...
I I I I I I I I I I I I I Mill
b/c
Figure 1 . — Courbe logistique
d'inflexion correspond à une valeur maximum de l'accroissement en valeur
absolue; au-delà de ce point, l'accroissement en valeur absolue du taux
de bacheliers décroît (Figure 2).
Le problème de l'ajustement logistique est d'estimer les trois paramètres
a, b, с L'utilisation de la méthode des moindres carrés ne donne pas
directement une solution puisque trois paramètres sont à estimer. Nous
utilisons une méthode itérative consistant à faire varier a — le plafond de
la courbe logistique — et à comparer les différents ajustements ainsi
obtenus suivant la valeur de a, plutôt que de conserver uniquement le
meilleur ajustement possible (5). Plusieurs prévisions peuvent dès lors être
réalisées et comparées, ce qui permet d'apprécier l'aléa de la prévision.
Pour comparer la fiabilité des différents ajustements selon la valeur de a,
trois indicateurs ont été retenus pour chaque hypothèse de prévision : le
coefficient de corrélation entre les données connues (1920-1987) et celles
calculées à partir de la courbe logistique obtenue par ajustement, l'écart
moyen entre ces deux séries de valeurs, le nombre d'écarts inférieurs à 1 %.
(5) Ce choix est celui de Cibois et Droes- la procédure sysnlin du logiciel sas (Statisti
beke (1988). Le plafond a qu'ils retiennent cal Analysis System).
(a = 44.2 %) est obtenu par l'utilisation de
244 :
Patrick Mear, Pierre Merle
a/2
Figure 2. — Accroissement absolu en fonction de N
La présentation des résultats correspondant à toutes les valeurs possibles
de a ne présente guère d'intérêt (6). Les résultats obtenus, figurant dans
le Tableau I, reproduisent les calculs relatifs à trois valeurs de a et sont
en nombre suffisant pour dégager les problèmes et idées essentiels.
Tableau I. — Statistique des écarts selon la valeur de a
(Données : 1920-1987)
a 44.2* 60 80 100 (en %)
Coefficient
de corrélation 0.991 0.9901 0.9890 0.9879
Ecart moyen (en %) 1 0.9825 0.9831 0.9962
Nombre d'écarts Illustration non autorisée à la diffusion
< à 1 % 45 43 43 39
150.08** b 118.977 113.032 110.021
с 0.076 0.0599 0.0567 0.0550
1974.7** 1986.3 1993.5 2000.4 b/c (inflexion)
Données Cibois et Droesbeke (1988).
Avec changement d'origine des temps.
(6) Les différents calculs ont été réalisés grâce à la construction d'un algorithme ad hoc :
la valeur de a étant fixée, b et с sont déterminés par une méthode des moindres carrés.
245 :
Revue française de sociologie
De cette statistique des écarts, deux constatations s'imposent.
— Selon l'indicateur retenu (coefficient de corrélation, écart moyen ou
nombre d'écarts inférieurs à 1 %), deux ajustements logistiques présentent
une fiabilité supérieure : le coefficient de corrélation est maximum (0.991)
quand la limite a du taux de bacheliers est 44.2 %; l'écart moyen
est minimum (0.9825 %) pour a égale 60 %. Quel ajustement faut-il choisir ?
— Mais le constat le plus intéressant tient à l'absence de différence
significative de cette statistique des écarts selon la valeur de a. Entre les
deux coefficients de corrélation les plus éloignés (pour a = 44.2 % et
a = 100 %), la différence n'est que de 0.003 point ! Les différences ne sont
pas sensiblement plus significatives pour les autres indicateurs d'écart.
Les quatre ajustements logistiques réalisés (de a = 44.2 % à a = 100 %)
sont donc statistiquement acceptables de façon égale. Cependant, ces
quatre modélisations correspondent à des prévisions à moyen et à long
terme fortement dispersées. Le taux de bacheliers par génération en 1990
étant connu (43.72 %, résultat provisoire), il est possible de calculer l'écart
entre ce taux et celui résultant des différentes prévisions (de a = 44.2 %
à a = 100 %).
Tableau II. — Prévisions du taux de bacheliers de 1990 à 2010
(selon la valeur de a)
Ecarts 44.2* a (en %) 60 80 100 prévisions
(en point)
1990 33.65 33.34 36.02 38.93
écart observé 10.07 10.38 7.70 4.79 5.59
Illustration non autorisée à la diffusion 1995 36.40 37.67 41.68 45.17 8.77
2000 38.55 41.69 47.29 51.40 12.85
2005 40.17 45.26 52.58 57.39 17.22
2010 41.36 48.33 57.44 62.94 21.58
Données Cibois et Droesbeke (1988).
Première constatation : l'ajustement présentant le meilleur coefficient de
corrélation (r = 0.991, avec a = 44.2 %) produit une prévision qui s'avère
une des plus inexactes à un horizon de trois ans. La sous-estimation de
la prévision est de 10.07 points pour l'année 1990, et cet ajustement est
désormais caduc : les taux prévus les années postérieures à l'an 2010
sont déjà dépassés en 1990.
Deuxième constatation : les écarts de prévisions sont, bien évidemment,
d'autant plus marqués que l'horizon de la prévision est éloigné — l'erreur
maximum entre les prévisions les plus extrêmes (pour a = 44.2 % et
a = 100%) est, à un horizon de dix ans, de 12.85 points (soit un
246 Patrick Mear, Pierre Merle
dépassement d'un tiers du taux de bacheliers prévu avec a = 44.2 %). Ces
quatre modélisations logistiques et les prévisions divergentes présentées
ci-dessus montrent que ces modèles ne permettent pas de prévoir la
croissance du taux de bacheliers par génération à moyen et à long terme.
A l'indétermination de la modélisation par une loi statistique correspond
finalement l'impossibilité de la prévision : la diversité des prévisions
satisfaisantes statistiquement implique la fausseté virtuelle de ces prévi
sions. Il faut donc en conclure qu'une très bonne corrélation entre un
phénomène observé et une loi mathématique, qui permet généralement de
rendre compte des processus de diffusion, constitue une condition éven
tuellement nécessaire mais certainement non suffisante pour valider la
prévision d'un fait social (Figure 3).
Deux explications peuvent être données à ce résultat a priori paradoxal.
D'une part, l'utilisation d'un modèle logistique pour prévoir l'évolution
d'une population pose un problème majeur qui explique en partie les
erreurs de prévision précédemment signalées. Soit le phénomène étudié est
suffisamment avancé pour identifier indiscutablement un point d'inflexion
(a/2) et/ou la limite supérieure de son développement (a), et dès lors
l'étude prévisionnelle ne présente guère d'intérêt. Soit aucun point
d'inflexion n'est certain — graphiquement ou par calcul — et le risque est
alors grand d'assimiler un accident conjoncturel à une rupture du rythme
de croissance. Les données relatives aux taux de bacheliers par génération
de 1920 à 1987 permettent d'ailleurs un bon ajustement par une fonction
exponentielle (cf. infra), ce qui rend incertaine l'existence d'un point
d'inflexion et signifie que la prévision à court et moyen terme peut être
réalisée à l'aide d'un modèle exponentiel. Autre façon de dire que les
points d'inflexion déterminés antérieurement (1974, 1986, 1993, 2000) par
différents ajustements logistiques totalement satisfaisants statistiquement
(Tableau I) constituent des hypothèses mathématiques dont il serait vain
de trouver un fondement social concret dans la courbe du taux de
bacheliers par génération.
D'autre part, les recherches prévisionnelles fondées sur une modélisat
ion logistique négligent trop souvent l'étude de l'adéquation entre les
hypothèses de la modélisation et la — ou les — variable(s) susceptible(s)
d'influencer — ou de produire — le phénomène étudié. Plus généralement,
modélisations et prévisions doivent nécessairement être articulées à un
contexte économique, social et politique dont l'étude est primordiale (7).
(7) P.-F. Verhulst précise de façon assez métrique de la population — i.e. exponen-
détaillée les causes qui agissent sur l'augmen- tielle — présentée par T.-R. Malthus en 1798
tation de la population et discute de la dans son Essai sur le principe de population.
validité de l'hypothèse d'une croissance géo-
247

Un pour Un
Permettre à tous d'accéder à la lecture
Pour chaque accès à la bibliothèque, YouScribe donne un accès à une personne dans le besoin