[fpr 796] 小・中学新学力テスト

A. Kamata

鎌田@ミシガン州立大学大学院です。

文部省の新学力テストについてですが、文部省がどのようにしてあの結論に達したか
は正確には知りかねますが、テスト理論(項目反応理論)の見地から私の解釈を述べ
ようと思います。


> ・記事には、前回1982-83年実施時との正答率の比較表が載っていましたが、そもそも
> 同じ問題を出さないのに、どうやって比較ができるのでしょうか。常識的には、正答率
> が下がったとしても、学力が低下したためか、単に難しい問題が出たためか判別できな
> いはずです。それとも、部分的に同じ問題を組み込んで、その正答率が同じであること
> を難易度が同じであるという根拠にしているのでしょうか。

前回と今回の成績の比較は、違う問題でも、同じ1次元の潜在特性(unidimensional
latent trait) を測定する問題であるという前提であれば、相互に比較可能です。

項目パラメータの推定値は、同じ項目でもその項目が含まれるテストごとに違う推定
値が得られます。つまり、違う尺度で推定されてしまう訳です。同じ問題は、同じ母
集団に対して同じパラメータ値を持つはずですから、複数のテスト間で共通項目
(anchor items)
を含めば、その共通項目のパラメータ値が同じという仮定のもとに、違うテストの尺
度を同一の尺度に変換できます。すなわち、違うテストの違う問題も、直接比較可能
になるわけです。この操作をテスト等化 (test equating) といいます。

私が記事を読んだ記憶によると(Asahi.comのダイジェストだけですが)、前回と同
じ問題も部分的に出題したと書いてありました。これは共通項目で、明らかにテスト
等化の目的に使われていると思われます。

項目パラメータの推定値により、ある個人が特定の項目に正答する確率(厳密にいう
と、特定の能力が与えられている場合の条件付き確率)が各項目ごとに計算できます
。例えば、その値の被験者全体の平均を取れば、それが、特定の問題へ正答する確率
の母集団の平均値の推定値として扱うことができます。また、それを正答率に変換す
ることも容易です。もちろん等化された後では、その値は違うテスト間でも比較可能
のはずです。

> 小学国語「文章表現力や自分の考えをもつ力が、読みとる力と比べてやや低い」
> と書かれてありましたが、質的に異なる力をどうやって比較しているのでしょうか。

これは全くおっしゃる通りで、質的に違うもの(違う潜在特性)を直接比較すること
はできないはずです。私もどうやって比較したのか知りたいです。

ただ、この結論にいたる過程として、私だったら2通り考えます。(1)「文章表現
力」も「読み取る力」も、1次元の「国語力」として扱い項目分析を行った後で、項
目をグループ分けしてグループごとの成績を出した。(2)各領域ごとに個別に分析
が行われ、文部省が何らかの方法で決めた、各領域の到達度のスタンダードをもとに
したコメントである。

(1)の方法は、理論的にはとんでもない方法ですが、結構こちらでも平気で行われ
ています。

以上、事実には基づきませんが私の解釈です。もし直接関わられた方がいたら、是非
本当のところを知りたいです。

鎌田明人



-------------------------
Aki Kamata
3224-2D Trappers Cove
Lansing, MI 48910
U.S.A.

tel/fax (517) 393-8718
kamataak (at) pilot.msu.edu
http://www.msu.edu/user/kamataak
-------------------------


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。