Cours : Validité d'un test psychologique



La validité d'un test est sa qualité à mesurer effectivement ce qu'il est censé mesurer. Comme la sensibilité et la fidélité des tests, la validité est une propriété générale de tout instrument de mesure. Un test psychologique valide mesure de façon correcte la dimension psychologique pour la mesure de laquelle il a été conçu.

Pour être valide, un test ou une épreuve, doit respecter la validité de plusieurs de ses composantes : validité de contenu, validité empirique, validité théorique.

Validité du contenu d'un test
Elle correspond à la possibilité de décrire complétement le contenu de l'épreuve et ce que l'on veut mesurer. Un test valide au niveau du contenu doit ainsi avoir une assise théorique et descriptive : les liens entre les items et la dimension psychologique mesurée doivent au possible être prouvé (forte corrélation), et les items doivent couvrir l'ensemble des aspects de la dimension étudiée. Par exemple, on ne peut pas décrire l'humeur en demandant seulement "êtes vous joyeux ou triste?", il faut d'autres items explorant de façon plus précise cet aspect, mais également d'autres aspect tel que l'aspect temporel (constance de l'humeur ou labilité, etc...). 

Le test doit donc présenter des items mesurant effectivement la dimension psychologique, ces items doivent être exhaustifs et représentatif de l'ensemble des questions que l'on veut se poser. 

Validité empirique d'un test psychologique

Lorsque l'objectif du test est défini de manière pratique, il faut s'assurer que le test remplit bien les conditions qui permettront de réaliser cet objectif pratique, "sur le terrain".

Si le but est le diagnostic d'une pathologie (validité diagnostique) : le test est valide empiriquement lorsqu'il permet effectivement d'identifier les troubles et de préciser leur nature. La validation se fait alors en référence à une théorie sous-jacente, en situation clinique, avec l'aide d'autres outils permettant de connaître a priori le diagnostic et ses composantes. Il ne s'agit en quelque sorte de vérifier si les résultats du test sont cohérent avec la situation clinique de l'individu qui passe le test, situation que l'on connait auparavant.

Si le but est d'émettre un pronostic (validité concurrente ou prédictive) : le test est valide si les résultats sont confirmés à la suite de la passation du test, par les faits. Par exemple, si l'on souhaite construire une épreuve permettant de trouver de bons vendeurs, on cherche des critères indépendants de l'épreuve qui permettront de juger le plus objectivement possible la qualité (la dimension psychologique) que l'on souhaite pronostiquer. On prendra par exemple le taux de vente réalisé par des vendeurs. Ce taux correspond à un critère à postériori, indépendant de l'épreuve, et qui reflète au mieux sa qualité de vendeur. On va ainsi comparer les résultats au test avec le ou les critères choisis (on parle alors de validité concurrente, car épreuves et critères sont étudiées en même temps). La corrélation obtenue entre les résultats et les valeurs aux critères choisis indiquent si le test est valide empiriquement.

On peut également introduire un délai entre la passation de l'épreuve en construction, et le relevé des valeurs des critères (on parlera alors de validité prédictive). Cette méthode est plus rigoureuse mais pas toujours facile à mettre en place, puisqu'elle prend plus de temps pour pouvoir effectuer la comparaison. 

Dans chaque cas, le choix des critères se révèle très important. La validité prédictive étant plus coûteuse en temps, on la choisira en fonction du matériel et de l'épreuve. Dans le cas d'une validité concurrente ou prédictive, on se satisfait généralement d'un coefficient de Bravais-Pearson de r >= 0.40 (l'épreuve prédit généralement quelque chose de très complexe, dont l'évolution est difficile à estimer de manière exhaustive). 

Validité théorique d'un test

La validité théorique d'un test est également appelée validité de construction (ou conceptuelle, ou encore hypothético-déductive).

L'objectif d'une épreuve est défini par la dimension psychologique abstraite que l'on souhaite objectiver grâce à l'épreuve (test d'intelligence, d'anxiété,…). On va donc partir de la théorie pour émettre des hypothèses permettant de prédire les résultats de l'épreuve. L'épreuve sera ensuite effectivement passée dans les conditions émises pour l'hypothèse, et on pourra vérifier que l'épreuve respecte la théorie à l'origine de sa construction. Bien évidemment, il est inutile de tester les fondements sur lesquels l'épreuve a été construite (puisque cela reviendrait à revenir en arrière par le même chemin) : on va tester des propositions issues de la théorie, indépendantes des bases de départ mais cohérentes avec celles-ci.

Par exemple, si on dispose d'une théorie explicative de la dimension de la vision spatiale : on construit alors l'épreuve en se basant sur cette théorie, et on vérifie par la suite, non seulement qu'elle respecte la théorie de départ, mais qu'elles respecte des hypothèses fondées sur cette théorie, non prises en compte pour la conception du test.

Pour effectuer ces vérifications, on aura recours principalement à deux types d'hypothèses : des hypothèses sur des liaisons attendues avec d'autres tests, et des hypothèses sur les effets attendus d'une variable externe au test, dont on prédit qu'elle devrait changer les résultats.

Hypothèses sur des liaisons attendues avec d'autres tests (validité nomologique)

Régulièrement, lors de la conception d'un test, la théorie sous-jacente peut se rapprocher d'autres théories préexistantes, qui possèdent déjà des tests valides. Par exemple, si l'on construit un test d'intelligence : si notre théorie de l'intelligence est proche de celle que défend Spearman, on devrait s'attendre à une liaison entre le test construit et un autre test construit selon le modèle théorique défendu par Spearman. Autre exemple : on sait qu'il y a des liens entre le changement d'humeur et la maniaco-dépression. Si un test que l'on vient de construire, évaluant la labilité émotionnelle (changement d'humeur) donne des résultats corrélés avec un test pré-existant (et valide) diagnostiquant la maniaco-dépression, alors, on acquiert une validité théorique pour le test en construction.

Hypothèses sur les effets attendus (validité hypothético-déductive)

On va appliquer au test en construction, une méthodologie expérimentale : il s'agit d'imaginer l'effet d'une variable sur le test, et ses effets attendus, dans un cadre théorique cohérent. On émet et teste l'hypothèse en recherchant l'effet attendu. 

Par exemple, on veut construire un test mesurant la force d'une peur phobique. On réalise un questionnaire (test en construction). Selon toute vraisemblance (hypothèse issue de la théorie) si l'on augmente le niveau d'anxiété, on s'attend à ce que le score au test augmente avec. On fait donc passer le test à des sujets qui ont une peur phobique des araignées : une première fois en situation normale, puis une seconde fois après avoir manipulé leur niveau d'anxiété. Si l'on observe une corrélation entre les variations du niveau d'anxiété chez des personnes phobiques et les variations au test en construction, on peut en déduire que le test en construction mesure bien (si aucune autre explication théorique ne permet de contredire l'hypothèse de départ!) ce qu'il est censé mesurer.

Il existe également une validité théorique factorielle (reposant sur l'analyse factorielle).

La validité est la dernière propriété à vérifier lors de la construction d'un test, car elle est la plus complexe. Il y a effectivement une certaine hiérarchie entre les propriétés générales (sensibilité, fidélité, validité), de la plus élémentaire à la plus complexe. La sensibilité est la propriété la plus élémentaire à vérifier, ensuite, on vérifie la fidélité : un test ne peut pas être fidèle s'il n'est pas sensible, mais il peut être sensible et non fidèle. De même, un test qui n'est pas fidèle ne peut pas être valide.