Étalonnage et technique psychométrique. Procédés de calcul. - compte-rendu ; n°1 ; vol.27, pg 851-866

De
Publié par

L'année psychologique - Année 1926 - Volume 27 - Numéro 1 - Pages 851-866
16 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : vendredi 1 janvier 1926
Lecture(s) : 18
Nombre de pages : 17
Voir plus Voir moins

3° Étalonnage et technique psychométrique. Procédés de
calcul.
In: L'année psychologique. 1926 vol. 27. pp. 851-866.
Citer ce document / Cite this document :
3° Étalonnage et technique psychométrique. Procédés de calcul. In: L'année psychologique. 1926 vol. 27. pp. 851-866.
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1926_num_27_1_6399ETALONNAGE ET TECHNIQUE PSYCHOM ETHIQUE 851
H. WOODROW. — ■ A picture-preference character test. {Un test de
caractère basé sur le choix d'images). — J. of ed. Ps., XVII, 8, 1926,
p. 519-531.
L'auteur a élaboré et appliqué à de nombreux enfants des écoles
de St-Paul et de Minneapolis un test de caractère dont il désirait dé
terminer la valeur.
44 gravures représentant des scènes de la vie courante ont été
groupées, à raison de 4 par pages, en un cahier que l'on place entre les
mains du sujet. L'enfant doit pour chaque feuille classer les 4 images
par ordre de préférence. La note obtenue par le sujet n'est autre que
la somme des différences entre la place assignée par lui à chaque
image et celle que cette dernière occupe dans le classement type
établi empiriquement par l'auteur, après application du test sur 648
enfants. On se trouve ainsi en présence d'une classification des su
jets par ordre de démérite. La corrélation negativer de — 0,24 qu'elle
donne avec l'intelligence générale, mesurée par le test individuel
de Kuhlmann, signifie donc que « sans aucun doute, l'intelligence est
nécessaire pour l'observation et l'interprétation des images ». W. a
également comparé les résultats du test aux jugements des profes
seurs appréciant 10 traits de caractère de l'enfant. Il a dans ce cas
obtenu des corrélations -f- 0,43 à -f- 0,38, à son avis insuffisantes.
Une meilleure adaptation du test et un remaniement s'imposent.
A. B.-F.
G. SCHWESINGER. — Slang as an Indication oî Charakter. {V argot
comme un indicateur du caractère). — J. of appl. Ps., X, 2, 1926,
p. 245-263.
Application d'un test de connaissance d'argot à deux groupes de
délinquants juvéniles et aux élèves d'écoles primaires. Résultats
contradictoires. D. W.
3°. — Étalonnage et technique psychométrique
Procédés de calcul
H. LÄMMERMANN. — Bericht ueber die Eichung einer Serie von
Gruppentests für acht- bis vierzehnjährige Volksschuler. [Etalonnage
d'une série de tests collectifs pour les écoliers de 8 à 14 ans). — Z.
für ang. Ps., XXVII, 1-2, 1926, p. 1-41.
L'auteur, chargé de mettre au point l'examen psychologique des
écoliers pour le passage d'une classe à l'autre, a élaboré une série
de tests destinés à la mesure du développement intellectuel. Les
épreuves, au nombre de 4 — opposition, complètement, calcul,
ordination de mots — ont été appliquées à 1592 enfants des écoles
primaires de Manheim âgés de 8 à 14 ans. Les corrélations moyennes
[h) entre les résultats de chacun des différents tests et l'appréciation
qualitative du développement intellectuel de l'enfant par le maître,
calculées d'après la méthode propre de l'auteur, ont été assez élevées,
soit respectivement, -4- 0,63, + 0,72, -f- 0,61 et -f- 0,55,+ 0,68 : ce
qui donne pour l'ensemble des tests une corrélation globale moyenne 852 ANALYSES BIBLIOGRAPHIQUES
de + O|61. Cette corrélation devient de -}- 0,79, si l'on attribue à
chaque test un coefficient de poids g = - — k — -
Les courbes de répartition montrent que les différents degrés des
tests sont assez bien adaptés aux classes auxquelles ils sont destinés.
La répartition finale des sujets en 5 groupes (5 %, 20 %, 50 %,
20 %> 5 %,) permet une sélection satisfaisante des écoliers.
A. B.-F.
L.-L. THURSTONE. — The mental age concept. (Le concept d'âge
mental). — Ps. Rev., XXXIII, 4, 1926, p. 268-279.
T., tout en rendant hommage au génie de Binet, qui a été le créa
teur de la mesure objective de l'intelligence, critique vivement la
notion d'âge mental, introduite par cet auteur.
Cette notion est ambiguë. On peut en effet définir l'âge mental de
deux façons différentes : ou bien l'âge chronologique auquel corre
spond la moyenne des succès pour un test, ou bien l'âge chronologique
moyen des sujets qui réussissent le test. Ces deux définitions n'ont
pas la même valeur numérique. Elles ne sont pas interchangeables.
Elles peuvent être toutes deux défendues par de bonnes raisons, mais
en pratique, c'est surtout la première qu'on adopte généralement.
Par une discussion très serrée, T. montre les inconvénients de cette
ambiguïté et comment l'emploi de cette notion conduit à des résul
tats contraires au sens commun. En particulier, elle n'a plus de signi
fication, quand on étudie l'adulte. Il est absurde de répéter, comme
on l'a fait si souvent, que d'après les résultats donnés par PArmy
test, l'âge mental moyen de la population adulte est de 12 à 13 ans.
Car cette vaste enquête a assurément autant de valeur, pour la dé
termination de moyennes, que les quelques centaines d'expériences
faites sur les enfants des écoles. En réalité la relation du test avec
l'âge est imparfaite et non régulière.
Il vaudrait donc mieux abandonner complètement cette notion
d'âge mental et la remplacer par le centilage ou la notion de l'écart
moyen. G. P.
E. HURLOCK. — The effect of incentives upon the constancy of
the I. Q. (L'effet de stimulants sur la constance du Q. /.). — Ped.
Sem., XXXII, 3, 1925, p. 422-434.
Les tests nationaux d'intelligence (National group intelligence
tests ; échelle B ; forme 1 et 2) ont été appliqués collectivement à
2 reprises, sur 273 enfants divisés en 3 groupes. Avant la deuxième
épreuve le groupe a, ou groupe de contrôle, ne reçoit aucune indica
tion, le groupe b est encouragé par des louanges, le groupe c est sévè
rement réprimandé.
Dans les deux derniers cas l'auteur a constaté une amélioration
des résultats assez marquée pour être significative : le Q. I. moyen
se trouve augmenté de 7 points, alors que sous le seul effet de l'exer
cice cet accroissement n'a été que de 1 point, pour le groupe de con
trôle.
L'analyse du test a montré que les améliorations portent princ
ipalement sur les problèmes de comparaison et d'analogies. ÉTALONNAGE ET TECHNIQUE PSYCHOM ETRIQUE 853
On trouvera dans cet article une revue détaillée des travaux anté
rieurs concernant l'influence de différents facteurs externes sur le
résultat des tests d'intelligence. A. B.-F.
G.-S. SLOCOMBE. — The measurement ol intelligence. (La mesure
de V intelligence). — J. of ed. Ps., XVII, 9, 1926, p. 600-607.
L'auteur, adepte de Spearman, détermine la valeur d'un test d'in
telligence par ses rapports avec « un facteur général hypothétique »,
c'est-à-dire pratiquement par la corrélation entre ce test et un nombre
supposé infini de tests analogues. Il a ainsi établi l'efficience (intellec
tive saturation) de 10 tests américains, et trouvé que pour une combi
naison des 5 meilleurs d'entre eux, les erreurs possibles sont encore
de 10 %. Il propose, en terminant, 5 méthodes par lesquelles la me
sure de l'intelligence pourrait être rendue plus efficace. A. B.-F.
HELEN PEAK et EDWIN G. BORING. — The factor of speed
in intelligence. (Le facteur de rapidité dans l'intelligence). — J. of
exp. Ps., IX, 1926, p. 71-94.
Il y a deux sortes de tests intellectuels, les tests de vitesse et
ceux du « tout ou rien » dans lesquels on ne tient pas compte de la
vitesse. Mais si on ne veut pas faire de ces derniers de pures épreuves
de connaissances acquises, on augmentera toujours leur sensibilité
en tenant compte du temps.
Supposons qu'un homme inférieur obtienne dans un test d'aussi
bons résultats supérieur à condition qu'on lui laisse
plus de temps : cela peut s'expliquer de deux façons. Ou bien il
accomplit aussi vite que l'autre les actes essentiels, mais perd du
temps à des actes inutiles ; ou bien ce sont les actes essentiels eux-
mêmes qui demandent plus de temps. Pour décider entre ces dçux
hypothèses, on fait les expériences suivantes.
On donne à cinq personnes plusieurs séries de tests (Tests Otis A et
B. Tests Alpha 5 et 6 de l'armée américaine), sans leur imposer de
limites de temps, mais en les prévenant qu'on tiendra compte ä la
fois de la vitesse et de l'exactitude. Toutes les épreuves sont exé
cutées dans l'ordre et sans revenir en arrière ; par conséquent celui
qui travaille rapidement ne peut, lorsqu'il a terminé, revenir sur une
question traitée incomplètement, ni corriger ses erreurs. On trouve
que ce sont les sujets les plus rapides qui ont obtenu, dans un temps
donné, le plus de résultats exacts. Si à la fin le sujet « lent, mais
exact» finit par en avoir davantage, c'est qu'il travaille plus long
temps ; cela tient aux conditions spéciales de l'expérience. Dans la
vie pratique, les sujets accomplissent, dans des délais qui ne sont
jamais, en fait, illimités, moins d'actes exacts que leurs rivaux.
L'ordre d'intelligence est celui qui est établi par la valeur des résul
tats au moment ou le sujet le plus rapide a terminé le test.
( Si on considère les épreuves auxquels fous les sujets répondent
correctement et qu'on compare les temps individuels, on trouve,
malgré les variations accidentelles inévitables dans des expériences
aussi complexes, que l'ordre de vitesse des sujets est le même que
l'ordre d'intelligence déterminé plus haut. On peut donc admettre
que les différences individuelles de vitesse sont inhérentes à l'acte 854 ANALYSES BIBLIOGRAPHIQUES
intellectuel qui correspond à la solution même du problème le plus
simple et non'à des déviations accidentelles de l'attention. Ce résultat
suggérait l'idée d'étudiej- des phénomènes encore plus simples : les
temps de réaction. Ici encore le classement est le même. Le temps
de réaction serait doi^un indice valafrle de l'intelligence. Cependant
les auteurs eux-mêmes reconnaissent qu'il faudrait vérifier ces ré
sultats sur un plus grand nombre de sujets, et entreprendre des re
cherches pour expliquer les légères variations de rang qui existent
encore entre les sujets dans les différents groupes d'expériences. P. G.
C.-W. ODELL. — Some data as to the effect of previous testing upon
intelligence tests scores. {Quelques données relatives à V influence
de V 'application préalable de tests sur les résultats des tests d'intelli
gence). — J. of ed. Ps., XVI, 7, 1925, p. 482-486.
Le test d'intelligence de Otis (Otis Self-administrating test of
mental ability, higher examination, form A) appliqué à 5.283 élèves
des « High-schools » de l'état d'Illinois, a donné, pour les sujets qui
avaient été soumis à un autre test d'intelligence au cours de l'année,
un QI à peine supérieur (1 à 2 points) à celui des élèves non examinés
préalablement.
D'autre part des exercices préparatoires répétés pendant plu
sieurs semaines avant l'application du test alpha de l'armée, ont élevé
de 36 à 37 points le QI des élèves entraînés. Cet avantage a complète
ment disparu 2 années après l'apprentissage. A. B.-F.
R. PINTNER. — Group tests after several years. {Répétition de tests
collectifs après plusieurs années). — J. of éd. Ps., XVI, 6, 1925,
p. 391-395.
L'application du « non language test » de Pintner aux enfants de
deux écoles de sourds-muets, a été répétée après 4 années d'inter
valle dans le double but de déterminer, d'une part, l'effet de la répé
tition d'un test sur les mêmes sujets, et, d'autre part, les variations
des niveaux mental et scolaire des enfants fréquentant l'école.
Dans un des établissements, l'amélioration du travail scolaire,
correspondant à un indice mental constant, montre qu'il y a eu amél
ioration des méthodes d'enseignement. Dans les deux cas les indices
d'intelligence ont été trouvés constants, en dépit des fluctuations de
la population scolaire. Pour 26 enfants examinés en 1919 et 1923,
la corrélation pour le niveau mental a été de 0,70.
D'une manière générale, l'âge mental, supérieur à l'âge scolaire,
montre que l'éducation des sourds-muets pourrait être hâtée.
A. B.-F.
R. GRUNDLACH. — The effects of practice on the correlations
of three mental tests. (L' 'effet de V exercice sur les corrélations de
trois tests mentaux). — J. of ed. Ps., XVII, 6, 1926, p. 387-401.
39 étudiants on été soumis pendant 25 jours à des formes diffé
rentes des 3 mêmes tests : 1° séries de nombres à compléter ; 2°
barrage ; 3° multiplications.
Les résultats ont montré : ETALONNAGE ET TECHNIQUE PSYCHOMETR1QUE 855
a) Que la dispersion du groupe restait à peu près constante pen
dant la série d'épreuves ;
b) Que la répétition avait pour effet d'augmenter légèrement les
corrélations entre les tests 1 et 2, 1 et 3, mais non pas celle des tests
2 et 3 ;
c) Que les corrélations avec l'intelligence restent pratiquement les
mêmes ;
d) Que la première épreuve permet de prédire assez exactement la
position future du sujet dans de nouvelles applications du même
test. A. B.-F.
HARVEY CARR. — The reliability of the maze experiment. {La
valeur de V experience du labyrinthe). — J. of comp. Ps,VI, 1,
1926, p. 85-94. — WALTER S. HUNTER. — A reply to professor
Cart on the reliability of the maze experiment. (Réponse au profes
seur Carr). — J. of comp. Ps., VI, 5, 1926, p. 393-397.
Hunter a critiqué l'expérience du labyrinthe : il a étudié les corré
lations internes des résultats d'une même sorte d'épreuves (paires
et impaires — après un intervalle de temps, etc. — ) et les corrélations
externes de différents problèmes (différents types de labyrinthes,
boîtes, plan incliné, etc.). Il conclut que les résultats dépendent trop
du hasard, pour servir de mesure aux aptitudes.
Personne ne nie le rôle du hasard et cette laborieuse démonstration
était inutile. Mais Hunter a tort de dire qu'une méthode trop gros
sière pour déceler des différences individuelles ne peut pas servir à
caractériser deux groupes, si ces groupes sont très différents. Le
manque de corrélation entre les épreuves au commencement et à la
fin d'une éducation ne prouve rien contre la validité de la méthode,
puisque ce n'est plus le même fait qu'on mesure. Le calcul des pro
babilités montre quelle est, dans chaque problème, la probabilité
pour qu'une différence entre des moyennes ne soit pas fortuite : il n'est
pas nécessaire pour cela que les différences entre les observations
individuelles proviennent de d'aptitudes plutôt que de
toute autre cause.
Hunter dit aussi que les résultats obtenus sur un groupe ne sont pas
confirmés par ceux d'un autre groupe travaillant dans les mêmes
conditions. Mais supposons que dans des conditions diff érentes Ail y
ait vingt chances contre une pour que les différences observées soient
dues au facteur A et non à un facteur accidentel X. Cela signifie que
si nous expérimentions sur un très grand nombre de groupes, nous
nous tromperions une fois sur vingt-et-une en attribuant la diffé
rence observée au facteur A. Donc, même si la différence A est mise
hors de cause, on peut encore s'attendre à des différences accident
elles du même ordre de fréquence. La science n'atteint qu'à la pro
babilité et non à la certitude.
Hunter a répondu à cette critique qu'il n'a pas attaqué le principe
même des méthodes statistiques, mais qu'il faut dans chaque cas
étudier la valeur de l'instrument de mesure employé. Dans des tests
appliqués à l'homme, il a obtenu des corrélations satisfaisantes, de
0,58 ± 0,06 et même de 0,84 ± 0,025 ; dans l'expérience du laby
rinthe avec des animaux, les corrélations sont au contraire de 0,0 à 856 ANALYSES BIBLIOGRAPHIQUES
0,33, ce qui est insuffisant. Dire qu'on ne doit pas s'étonner de les
trouver aussi faibles, puisque les conditions ne sont pas identiques
d'une expérience à l'autre, c'est justement reconnaître que la mé
thode est mauvaise, car l'objet des mesures individuelles n'est atteint
que si elles peuvent servir à prévoir avec une certaine probabilité ce
qui arrivera dans d'autres expériences. Or les expériences avec les
labyrinthes n'ont pas cette valeur et beaucoup d'efforts inutiles ont P' été dépensés dans ces recherches depuis vingt ans. G.
CONSTANCE E. DOWD. — A Study of the consistence of Bate of
Work. (Etude de la cohérence dans le taux du travail). — Ar. of Ps.,
n° 84, 1926,33 p.
Un individu rapide l'est-il dans toutes les tâches, ou la rapidité
a-t-elle un caractère spécifique pour une tâche déterminée ?
L'auteur a comparé les résultats dans la vitesse d'exécution de
9 tests collectifs chez 175 enfants de 6e classe, ne gardant que les
épreuves douées d'une cohérence interne, d'une « reliabilité » suff
isante (coefficients de 0,90). Dans ces conditions, il a été obtenu des
coefficients de corrélation, tous positifs, compris entre 0,136 et 0,810.
Si les tests sont groupés en séries homogènes on obtient les indices
suivants entre ces séries :
Mouvements Barrage Ecriture Lecture Arithmétique de la main
Barrage... 0,505 0,465 0,266 0,331
Mouvem1» de la main 0,505 0,665 0,336 0,231
Ecriture 0,465 0,665 0,340 0,370
Lecture 0,266 0,336 0,340 0,139
Arithmétique 0,331 0,231 0,370 0,139
Avec les tests d'intelligence, les coefficients de corrélation pour
ces divers groupes sont pratiquement nuls (de 0,003 à 0,089).
Le coefficient est d'autant plus élevé qu'il s'agit de tâches plus
voisines (le maximum 0,810, concerne la corrélation des deux tâches
d'écrire des phrases et d'écrire des nombres). L'auteur conclut qu'il
n'y a pas de facteur général de rapidité, ajoutant d'ailleurs, ce qui
limite la portée de l'affirmation : « Si du moins il y a un facteur de
rapidité, il doit être d'une force minime ».
Mais le fait que toutes les corrélations sont positives suffit pour
affirmer qu'il y a bien quelque chose de commun dans toutes ces
épreuves, impliquant plus de rapidité, en général, ce facteur, ou ce
groupement de facteurs, n'apparaissant que grâce au calcul de
corrélation justement parce qu'il ne représente qu'un élément
parmi beaucoup d'autres régissant dans telle ou telle tâche déter
minée la vitesse effective d'exécution. H. P. ET TECHNIQUE PSYCHOM ETHIQUE 857 ÉTALONNAGE
B. WESTON et H.-B. ENGLISH. — The influence of the group on
psychological test scores. (L' influence du groupement des sujets sur
le rendement des tests psychologiques). — Am. J. of Ps., XXXVII,
4, 1926, p. 600-601.
Un test a été divisé en deux parties : la première a été traitée par
les sujets isolés, le second par les mêmes réunis dans la même salle ;
une autre série de sujets a traité la première partie en groupe et la
seconde isolément. Les résultats montrent une supériorité des résul
tats obtenus pair les sujets groupés. P. G.
S. WANG. — A Demonstration of the Language Difficulty Involved
in Comparing Racial Groups by Means of Verbal Intelligence
Tests. (Une démonstration des difficultés de langage influant sur
la comparaison, à l'aide des tests verbaux d'intelligence, des groupes
appartenant à des races différentes). J. of appl. Ps., X, I, 1926,
p.102-106.
Cette démonstration n'est pas très nette. L'auteur a appliqué un
test d'intelligence du type de l'Armée aux étudiants de l'Université
de Minnesota, parmi lesquels se trouvaient des Américains, des
Nègres, des Chinois, des Russes. Mais, d'une part, il n'a pu avoir de
renseignements sur la durée du séjour en Amérique et le degré d'amér
icanisation « des étrangers » ; d'autre part, le nombre de sujets
semble insuffisant. D.W.
T. KLIMOWICZ. — - La valeur sélective du test des récits absurdes
et de la définition des concepts. — ST. USAREK. — ■ Contribut
ion à l'étude de la définition chez l'enfant. — ST. USAREK et
HÉLÈN STRZEMECKA. — Remarques à propos de l'emploi
du test de la définition par l'instituteur. — Biuletyn Kola Psycho-
logicznego, I, 2, 1925, p. 45-52, 52-59, 59-62, et 62-63 (avec résu
més français p. 78-80, 80-83, 84.).
Utilisation par Kl. du test du récit absurde de Stern dans 4 classes
(dé 11 à 14 ans) sur 330 élèves. Quatre cas se rencontrent : absurdité
non remarquée ; absurdité constatée et comprise ; absurdité constatée
sans être comprise ; critique d'une phrase sans absurdité. Le nombre
moyen d'absurdités correctement reconnues est de 2,9 ; 4,3 ; 5,8 ;
et 6,0 pour les quatre classes. L'emploi du test de définition pour les
mots : proie, oncle, courage, jalousie, a montré que à 10 ans l'emploi
d'un mot général l'emportait (25,4 %) sur son emploi à 9 ans (17,1 %),
les autres modes de définition étant la tautologie, l'emploi d'exemples,
et enfin la définition proprement logique .
Les deux tests ont entre eux un coefficient de corrélation dé
0,533. Les élèves de 9 et 10 ans ayant réussi les deux tests furent
presque tous admis à l'examen d'entrée au lycée (9 sur 10).
Mme Us. a étudié chez 10 fillettes de 8 ans et demi (lre classe)
les définitions de 100 mots, afin de faciliter l'appréciation des résul
tats dans un test de ce genre. Elle a établi la proportion pour 100 des
cas où la définition est correcte (0,6) où il y a une systématique du
concept (9,1) où les caractères éventuels sont notés (25) où seuls
des caractères accidentels figurent (30), où il n'y a pas de caractères
tout en conservant une «liaison intérieure avec le concept » (28), où '
ANALYSES* 858 BIBLIOGRAPHIQUES
il n'y à pas de liaison du tout (6,2), enfin où il y a même contradict
tion(l,2).
L'auteur conclut que la définition correcte est possible quand elle
est très facile, n'impliquant que des idées à caractère perceptif, que
les idées générales restent très vagues et que l'enfant ne distingue les
caractères saillants d'objets peu connus s'il a été stimulé dans
sa vie affective par de tels caractères.
Elle croit à l'utilité de l'emploi du test des définitions, que Mlle
Str. juge subordonné encore à un travail d'analyse préalable. H. P.
J.-C. CANNON. — An Enquiry into the relative values of the inven
tive and selective forms of Group tests of mental Capacity. (En
quête sur les valeurs relatives des formes inventive et sélective de tests
collectifs de capacité mentale). — Austral. J. of Ps., IV, 2, 1926,
p. 141.
Un certain nombre de tests collectifs peuvent être utilisés soit
comme épreuves d'invention soit comme épreuves de sélection.
Exemples : a) Invention : fouille — verte.
terre — ... .,?
6) Sélection : feuille — verte.
terre — lourde, brune, utile, jardin.
Dans l'exemple a le sujet doit découvrir le quatrième terme, dans
l'exemple b, il doit choisir parmi les attributs proposés, il s'agit de
savoir quelle est la meilleure forme de présentation c'est-à-dire :
1° Si ces deux formes, inventive et sélective, mesurent la même
chose ;
2° Si l'une des deux formes saisit plus directement que l'autre
la 3° chose Si l'une en question des deux ; formes est plus digne de confiance que l'autre ;
4° Si des pçrmet un classement des sujets plus
exact que l'autre.
L'auteur emploie quatre tests : Analogies. Achèvement. Ressemb
lances. (Synonymes) et Contraires. Sujets : 95 enfants de 9 à 13 ans.
Matériel : Tests collectifs de Victorian Teachers College (classes 4 à 8.)
Chaque test (20 exemples) était donné deux fois dans chaque forme,
avec 8 jours d'intervalle, entre l'épreuve d'invention et l'épreuve de
sélection et avec 5 semaines d'intervalle entre la première séance
d'invention et la seconde. De plus, 40 enfants ont passé le test collect
if oral de Spearman. (Toutes les épreuves du type sélectif).
1° Les deux formes de tests mesurent-elles la même chose ? Corré
lation :
r = 0,9818 E. P. = dt 0,0066.
Si l'on admet que la vraie valeur de r est comprise dans c±5BP,
la plus basse valeur de r est de 0.95.
2° Une des deux formes a-t-elle des rapports plus étroits avec la
chose à mesurer ? Comparaison de chaque forme avec les résultats
de test d'intelligence de Spearman.
r Spearman —forme inventive = 0,71
r — forme sélective = 0,75 ET TECHNIQUE PSYCHO»! ETHIQUE 859 ETALONNAGE
Pas de différence significative si l'on tient compte du l'ait que le
test de Spearman est de forme sélective. Or, le test de Spearman
est construit pour mesurer g (facteur d'intelligence générale) ;si donc
l'une des deux formes de nos tests était plus imprégnée de g que
l'autre, elle devrait avoir avec le test de Spearman une corrélation
plus grande. Pratiquement donc, les deux tests se valent à ce
point de vue.
3° Une des deux formes est-elle plus digne de confiance ? Corréla
tion entre les résultats obtenus la première et la seconde fois.
Tests Analogie Ressemblance Contraire ment mélangés
0,67 Complète
Forme inventive.. . 0,65 0,82 0,98 0,79 0,77 sélective . . . 0,72 0,69 0,85
La faiblesse relative des corrélations pour les 4 sortes de tests tient
sans doute au petit nombre de questions posées (20). La haute corré
lation des résultats mélangés justifie cette interprétation. Il n'y a pas
de différence entre les résultats des deux formes.
4° Classement des sujets selon l'une ou l'autre des deux formes de
présentation.
La courbe des résultats obtenue par la méthode de sélection se
rapproche davantage de la courbe de distribution normale que celle
obtenue par la méthode d'invention.
En résumé, la forme sélective de présentation des tests est au
moms égale, peut être même supérieure à la forme inventive en ce
qui concerne les enfants au-dessous de 14 ans. Du point de vue pra
tique, la forme sélective est préférable car l'évaluation des résultats
est plus facile et plus uniforme. H. L.1
G.-U. CLEETON. — Optimum difficulty of group test items. {Diffi
culté optimum des questions dans les tests collectifs). — J. of appl.
Ps., X, 3, 1926, p. 327-340.
Dans les tests présentant des séries de questions de difficultés
graduées, ce ne sont pas forcément les plus difficiles qui classent le
plus exactement les sujets : au contraire, du moins en employant
les Thorndike Intelligence Examination et Iowa Content Examinat
ion, l'auteur trouve que ce sont les questions de difficulté moyenne,
sur une marge assez grande, qui ont la plus forte valeur « prédic
tive ». A. F.
M. MAY, et H. HARTSHORNE. — First steps toward a scale for mea
suring attitudes (Premiers pas vers une échelle de mesure des attitudes).
J. of ed. Ps., XVII, 3, 1926, p. 147-162.
Illustration, par l'étude de la malhonnêteté, des principes qui
doivent présider à l'établissement d'une échelle d'attitudes mentales.
A. B.-F.

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.