Par exemple, si un groupe d’étudiants passe un test, vous vous attendez à ce qu’ils présentent des résultats très similaires s’ils passent le même test quelques mois plus tard. Cette définition repose sur le fait qu’il n’y a pas de facteur de confusion pendant l’intervalle de temps intermédiaire.
Les instruments tels que les tests de QI et les enquêtes sont des candidats de choix pour la méthodologie test-retest, car il y a peu de chances que les gens connaissent un saut soudain dans leur QI ou changent soudainement d’opinion.
En revanche, les tests éducatifs ne sont souvent pas adaptés, car les étudiants apprendront beaucoup plus d’informations pendant la période intermédiaire et montreront de meilleurs résultats dans le deuxième test.
La fiabilité des tests et les ravages du temps
Par exemple, si un groupe d’étudiants passe un test de géographie juste avant la fin du semestre et un autre lorsqu’ils retournent à l’école au début du suivant, les tests devraient produire globalement les mêmes résultats.
Si, par contre, le test et le retest sont passés au début et à la fin du semestre, on peut supposer que les leçons intermédiaires auront amélioré les capacités des étudiants. Ainsi, la fiabilité du test-retest sera compromise et d’autres méthodes, comme le test fractionné, sont meilleures.
Même si un processus de fiabilité du test-retest est appliqué sans aucun signe de facteurs intermédiaires, il y aura toujours un certain degré d’erreur. Il y a de fortes chances que les sujets se souviennent de certaines des questions du test précédent et obtiennent de meilleurs résultats.
Certains sujets peuvent simplement avoir eu une mauvaise journée la première fois ou ne pas avoir pris le test au sérieux. Pour ces raisons, les étudiants qui font face à des reprises d’examens peuvent s’attendre à être confrontés à des questions différentes et à une norme de notation légèrement plus sévère pour compenser.
Même dans les enquêtes, il est tout à fait concevable qu’il y ait un grand changement d’opinion. Les gens peuvent avoir été interrogés sur leur type de pain préféré. Dans l’intervalle, si une entreprise de pain monte une longue et vaste campagne publicitaire, cela risque d’influencer l’opinion en faveur de cette marque. Cela compromettra la fiabilité du test-retest et donc l’analyse qui doit être traitée avec prudence.
Fiabilité test-retest et facteurs de confusion
Pour donner un élément de quantification à la fiabilité test-retest, les tests statistiques en tiennent compte dans l’analyse et génèrent un nombre compris entre zéro et un, 1 correspondant à une corrélation parfaite entre le test et le retest.
La perfection est impossible et la plupart des chercheurs acceptent un niveau inférieur, soit 0,7, 0,8 ou 0,9, selon le domaine de recherche particulier.
Cependant, cela ne peut pas éliminer complètement les facteurs de confusion, et un chercheur doit les anticiper et les traiter pendant la conception de la recherche pour maintenir la fiabilité test-retest.
Pour atténuer les chances que quelques sujets faussent les résultats, pour quelque raison que ce soit, le test de corrélation est beaucoup plus précis avec de grands groupes de sujets, noyant les extrêmes et fournissant un résultat plus précis.