Cours : Sensibilité d'un test ou d'une épreuve



Comme la validité et la fidélité d'un test, la sensibilité d'un test est une propriété générale, commune à toute épreuve construite pour tester un composant de la réalité. La sensibilité d'un test est également la première propriété à vérifier lors de la construction de l'épreuve.

Sensibilité et insensibilité d'un test en psychométrie

La sensibilité d'un test représente le pouvoir classant du test, sa capacité à discriminer les éléments testés lorsqu'ils diffèrent, et sa capacité à regrouper ces éléments lorsqu'ils convergent ou sont similaires. Un test n'est pas assez sensible lorsqu'il regroupe trop d'éléments testés qui diffèrent visiblement (exæquos). 

Lors de la construction des items d'un test, on doit vérifier sa sensibilité à deux niveaux :
  • - La sensibilité de chaque item (sous-tests de difficultés ou de mesures différentes)
  • - La sensibilité du score total
Un test qui n'est pas sensible ne peut être ni fidèle, ni valide, c'est pourquoi cette propriété est cruciale dans la construction du test, et pourquoi elle doit être étudiée en premier lieu. 

Une méthode simple pour éprouver la sensibilité d'un test consiste à le faire passer à un nombre suffisamment important de sujets (plus généralement, à tester plusieurs éléments). A partir des résultats obtenus, on peut construire un histogramme par lequel on va pouvoir vérifier à première vue, la distribution des fréquences. Si le test est sensible, les scores devraient être distribués normalement (courbe en cloche). Trois types de distribution peuvent signer un problème de sensibilité :
  • Un effet plancher : les sujets ont des scores massivement trop bas. Le test est donc trop difficile, personne n'arrive à avoir un score élevé.
  • Un effet plafond : les scores des sujets sont regroupés dans des valeurs trop élevées, le test est trop facile
  • Un effet barres : les éléments sont regroupés dans un nombre limité de valeurs, ne permettant que de différencier des groupes d’éléments, sans différenciation possible au sein d'un groupe. Un effet barres est normal lorsque les scores globaux présentent des valeurs discrètes en nombre limité, mais on peut douter de la validité de tels tests.
Procédure de réalisation d'un test sensible

Comment procède-t-on pour construire un test qui soit sensible? 

Prenons l'exemple d'un test arithmétique destinés à évaluer des enfants. On prend un programme officiel d'éducation en arithmétique, à l'âge correspondant. On construit l'épreuve à partir de ce programme, par exemple 50 problèmes (une échelle totale de 0 à 50)

Pré-test : on fait passer le test auprès d'un groupe contrôle (représentatif), et on regarde comment les scores se distribuent. S'il y a un problème lors de la construction de l'histogramme (voir paragraphe précédent), on examine la sensibilité des items, afin d'écarter les items dont le taux de réussite ou d'échec est trop élevé. On conserve ceux dont les taux se situent aux alentours de 50%, qui sont de purs discriminants. On rajoute ensuite éventuellement de nouveaux items que l'on estime plus discriminants que ceux qui ont été enlevés, et l'on recommence l'étape pré-test.

Pour élever la sensibilité d'un test, on peut :
  • travailler la sensibilité de ses items
  • augmenter le nombre d'items
  • affiner les critères de cotation (ce qui peut se faire au niveau de chaque item). Dans l'exemple, au lieu de désigner un score en 2 points (problème résolu, problème non-résolu), on peut par exemple donner une graduation plus fine, en 3 points : problème résolu, problème partiellement résolu (par exemple, étape 1 résolue, finalisation échouée), problème totalement non-résolu.
La sensibilité d'un test, en psychométrie, dépend notablement du temps et de certains effets tels que l'effet Flynn (augmentation du niveau de QI global dans le temps). Il est donc important de vérifier régulièrement la sensibilité des tests, et éventuellement de les réactualiser, surtout dans le cas de tests de connaissances, qui se montrent très sensibles à l'évolution des savoirs et des cultures.