Per esempio, se un gruppo di studenti fa un test, ci si aspetta che mostrino risultati molto simili se fanno lo stesso test qualche mese dopo. Questa definizione si basa sull’assenza di fattori confondenti durante l’intervallo di tempo intercorso.
Strumenti come i test del QI e i sondaggi sono i primi candidati per la metodologia test-retest, perché c’è poca possibilità che le persone sperimentino un improvviso salto nel QI o cambino improvvisamente le loro opinioni.
D’altra parte, i test educativi spesso non sono adatti, perché gli studenti impareranno molte più informazioni nel periodo intercorso e mostreranno risultati migliori nel secondo test.
Affidabilità dei test e le devastazioni del tempo
Per esempio, se un gruppo di studenti fa un test di geografia poco prima della fine del semestre e uno quando torna a scuola all’inizio del successivo, i test dovrebbero produrre più o meno gli stessi risultati.
Se, invece, il test e il retest vengono fatti all’inizio e alla fine del semestre, si può supporre che le lezioni intermedie abbiano migliorato le capacità degli studenti. Quindi, l’affidabilità del test-retest sarà compromessa e altri metodi, come lo split test, sono migliori.
Anche se un processo di affidabilità del test-retest è applicato senza segni di fattori intervenienti, ci sarà sempre un certo grado di errore. C’è una forte possibilità che i soggetti ricordino alcune delle domande del test precedente e abbiano una performance migliore.
Alcuni soggetti potrebbero semplicemente aver avuto una brutta giornata la prima volta o potrebbero non aver preso seriamente il test. Per queste ragioni, gli studenti che affrontano la ripetizione degli esami possono aspettarsi di affrontare domande diverse e uno standard di valutazione leggermente più duro per compensare.
Anche nei sondaggi, è abbastanza concepibile che ci possa essere un grande cambiamento di opinione. Le persone possono essere state interrogate sul loro tipo di pane preferito. Nel frattempo, se un’azienda produttrice di pane organizza una lunga ed estesa campagna pubblicitaria, è probabile che questo influenzi l’opinione a favore di quella marca. Questo comprometterà l’affidabilità del test-retest e quindi l’analisi che deve essere gestita con cautela.
Affidabilità test-retest e fattori di confusione
Per dare un elemento di quantificazione all’affidabilità test-retest, i test statistici inseriscono questo fattore nell’analisi e generano un numero tra zero e uno, dove 1 è una correlazione perfetta tra il test e il retest.
La perfezione è impossibile e la maggior parte dei ricercatori accetta un livello più basso, 0,7, 0,8 o 0,9, a seconda del particolare campo di ricerca.
Tuttavia, questo non può eliminare completamente i fattori di confusione, e un ricercatore deve prevederli e affrontarli durante il disegno della ricerca per mantenere l’affidabilità del test-retest.
Per smorzare le possibilità che alcuni soggetti alterino i risultati, per qualsiasi motivo, il test di correlazione è molto più accurato con grandi gruppi di soggetti, affogando gli estremi e fornendo un risultato più accurato.