鎌田@ミシガン州立大学大学院です。 文部省の新学力テストについてですが、文部省がどのようにしてあの結論に達したか は正確には知りかねますが、テスト理論(項目反応理論)の見地から私の解釈を述べ ようと思います。 > ・記事には、前回1982-83年実施時との正答率の比較表が載っていましたが、そもそも > 同じ問題を出さないのに、どうやって比較ができるのでしょうか。常識的には、正答率 > が下がったとしても、学力が低下したためか、単に難しい問題が出たためか判別できな > いはずです。それとも、部分的に同じ問題を組み込んで、その正答率が同じであること > を難易度が同じであるという根拠にしているのでしょうか。 前回と今回の成績の比較は、違う問題でも、同じ1次元の潜在特性(unidimensional latent trait) を測定する問題であるという前提であれば、相互に比較可能です。 項目パラメータの推定値は、同じ項目でもその項目が含まれるテストごとに違う推定 値が得られます。つまり、違う尺度で推定されてしまう訳です。同じ問題は、同じ母 集団に対して同じパラメータ値を持つはずですから、複数のテスト間で共通項目 (anchor items) を含めば、その共通項目のパラメータ値が同じという仮定のもとに、違うテストの尺 度を同一の尺度に変換できます。すなわち、違うテストの違う問題も、直接比較可能 になるわけです。この操作をテスト等化 (test equating) といいます。 私が記事を読んだ記憶によると(Asahi.comのダイジェストだけですが)、前回と同 じ問題も部分的に出題したと書いてありました。これは共通項目で、明らかにテスト 等化の目的に使われていると思われます。 項目パラメータの推定値により、ある個人が特定の項目に正答する確率(厳密にいう と、特定の能力が与えられている場合の条件付き確率)が各項目ごとに計算できます 。例えば、その値の被験者全体の平均を取れば、それが、特定の問題へ正答する確率 の母集団の平均値の推定値として扱うことができます。また、それを正答率に変換す ることも容易です。もちろん等化された後では、その値は違うテスト間でも比較可能 のはずです。 > 小学国語「文章表現力や自分の考えをもつ力が、読みとる力と比べてやや低い」 > と書かれてありましたが、質的に異なる力をどうやって比較しているのでしょうか。 これは全くおっしゃる通りで、質的に違うもの(違う潜在特性)を直接比較すること はできないはずです。私もどうやって比較したのか知りたいです。 ただ、この結論にいたる過程として、私だったら2通り考えます。(1)「文章表現 力」も「読み取る力」も、1次元の「国語力」として扱い項目分析を行った後で、項 目をグループ分けしてグループごとの成績を出した。(2)各領域ごとに個別に分析 が行われ、文部省が何らかの方法で決めた、各領域の到達度のスタンダードをもとに したコメントである。 (1)の方法は、理論的にはとんでもない方法ですが、結構こちらでも平気で行われ ています。 以上、事実には基づきませんが私の解釈です。もし直接関わられた方がいたら、是非 本当のところを知りたいです。 鎌田明人 ------------------------- Aki Kamata 3224-2D Trappers Cove Lansing, MI 48910 U.S.A. tel/fax (517) 393-8718 kamataak (at) pilot.msu.edu http://www.msu.edu/user/kamataak -------------------------
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。