テスト-反復テストの信頼性 – 単純な信頼性テスト

たとえば、ある学生グループがテストを受けた場合、数ヵ月後に同じテストを受けると、非常に似た結果を示すと予想されます。

IQテストやアンケート調査などの測定器は、IQが急に上がったり、意見が急に変わったりする可能性が低いため、テスト・リテスト法の有力候補です。

一方、教育テストはしばしば適しません。

Test-Retest Reliability and the Ravages of Time

たとえば、あるグループの学生が学期末の直前に地理のテストを受け、次の学期の初めに学校に戻ってからもう一つのテストを受けると、ほぼ同じ結果を出すはずである。

一方、テストと再テストが学期の始めと終わりに行われた場合、その間に行われた授業によって生徒の能力が向上していると考えることができるのです。 したがって、テスト・リテストの信頼性は損なわれ、スプリット・テストなど他の方法がよいだろう。

介入要因の気配がない状態でテスト・リテストの信頼性プロセスを適用しても、必ずある程度の誤差が生じる。 被験者が前回のテストの問題をいくつか覚えていて、より良い成績を出す可能性は高い。

被験者によっては、初回に運が悪かっただけかもしれないし、真剣にテストを受けていなかったかもしれない。 このような理由から、再試験に臨む学生は、異なる問題に直面し、それを補うために採点基準がやや厳しくなることが予想されます。

調査においても、意見が大きく変わることは十分に考えられます。 好きなパンの種類を聞かれたことがあるかもしれない。 その間に、あるパン会社が長期的かつ大規模な広告キャンペーンを展開すれば、そのブランドを支持する意見に影響を与える可能性がある。 このような場合、試験結果の信頼性が損なわれるため、分析には注意が必要です。

Test-Retest Reliability and Confounding Factors

テスト反復信頼性に数値化の要素を与えるために、テスト反復の信頼性を高める。 統計テストでは、これを分析に組み入れ、0から1の間の数値を生成する。1がテストと再テストの間の完全な相関である。

完璧は不可能であり、ほとんどの研究者は、特定の研究分野に応じて、0.7、0.8、または0.9という低いレベルを受け入れます。

ただし、これは交絡要因を完全に取り除くことはできず、研究者は研究設計中にこれらを予測して対処しなければ、テスト-リターンの信頼性を維持することはできません。

何らかの理由で少数の被験者が結果を歪めてしまう可能性を減らすために、相関のテストは大人数の被験者グループの方がはるかに正確で、極端な部分をかき消してより正確な結果を提供します。

コメントを残す

メールアドレスが公開されることはありません。