[fpr 3761] 不適切な呼称「古典テスト理論」

Yasuharu Okamoto


柴山さん。

 岡本のRe-mailです。

>1)古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使
>われています。
>「古典」という名称で排除されているわけではありません。

 「CTTは時代遅れの理論でだめで、IRTを使いなさい。」
という意見を見聞きしていますので、投稿メールを書いてみた次第です。

>2)古典的テスト理論とIRTは、モデルがそもそも違います。

 理論とモデルの区別をする必要があります。理論は異なります。
しかし、用いられているモデルは、最近の研究では共通している場合が
多いです。順序カテゴリ項目を扱う場合は、そうなります。もっとも、
CTTでは連続値をとる項目を扱うのが伝統的説明ですが、これはIRTでは
対象とされていません。理論は違いますが、CTTで順序カテゴリ項目を
扱う場合は、使われるモデルは同じタイプになっています。
サーストンタイプと呼ばれているものです。
心理尺度は、普通、順序カテゴリ項目ですので、そのことを扱う場合は、
CTTの場合もIRTと同様のモデルが用いられます。

>3)等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー
>です。

 IRTとCTTで使われている分析手法に時代差はないのではということの
説明に、現代のCTT理論における順序カテゴリ項目を扱うモデルでは、
例えば「等価」も扱えるのではということで持ち出しました。CTTでも、
等価を問題にしうるという意味です。順序カテゴリ項目を扱うCTTと
IRT(3カテゴリ以上の項目の場合も含みます)では、用いられるモデルは
同じ種類と思われます。

岡本

-----Original Message-----
From: SHIBAYAMA, Tadashi [mailto:sibayama (at) sed.tohoku.ac.jp]
Sent: Friday, April 8, 2016 2:49 PM
To: fpr ML <fpr (at) psy.chubu.ac.jp>
Subject: [fpr 3760] Re: [fpr 3759] 不適切な呼称「古典テスト理論」

岡本さん

 柴山@東北大です。ご指摘の3点ですが、

1)古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使
われています。
「古典」という名称で排除されているわけではありません。

2)古典的テスト理論とIRTは、モデルがそもそも違います。

3)等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー
です。

ご参考まで。

---柴山

On 2016/04/08 14:27, Yasuharu Okamoto wrote:
>  岡本@日本女子大学心理学科です。
>
> 心理学研究において最もよく用いられている尺度作成の理論は
> 古典テスト理論(Classical Test Theory: CTT)と呼ばれています。
> Spearman (1904)に始まるとされていますので、古典と呼ばれるに
> ふさわしいと思われます。これに対して現代テスト理論の1つに
> 項目反応理論(Item Response Theory: IRT)が挙げられています。
> IRTが現代的とされたとき、古典テスト理論という呼び方には違和感を
> 覚えます。古典テスト理論は現在心理学研究においてもっとも
> 使われている方法であり、現在も研究されている方法だからです。
> 以後、このメールでは、誤解を避けるため、古典テスト理論と呼ばずに
> 項目和テスト理論(Sum of item Scores Theory: SST)と呼ぶことにします。
> SSTもIRTも、現在では共通の統計モデル、(階層的)一般化回帰モデル
> が用いられ、分析法も同じ類のものが使われています。したがって、
> 研究における統計学的手法は現時点では違いがないということに
> なります。しかし、心理学における実証的研究のツールという
> 観点からは、以下の違いが挙げられます。
>
>  IRTでは、項目パラメタ値が与えられたテスト項目に対して、
> ある個人の能力値は反応パターンからの推定値であり、項目数が
> 少ないときは能力値の推定が不安定になります。個人の
> 反応パターンから能力値の推定を行うプログラム例は
> http://mcn-www.jwu.ac.jp/~yokamoto/books/pm/estability/
> に挙げてありますので、参考にして下さい。
> また、点推定値は推定法に依存して異なります。。
>  これに対してSSTでは、測定値は、項目和という観測データから
> 直接一意に与えらえれる数値です。
>  心理尺度は、当該の実証研究の目的に応じてその研究内で
> 開発される(先行研究の結果が確認される)ことが多く、
> データ数がIRTによる分析が可能であるほど多くはないのが
> 普通です。SSTでは、一応安定した因子分析が可能であれば
> (因子構造がきれいな場合はサンプル数は少なくてよい;
> cf. Thompson,2004, Exploratory and Confirmatory Factor Analysis,
> p.24)分析できるので、通常の実証的心理学研究に
> おいては、SSTはIRTより現実的分析法であると思います。
>
>  IRTでは、等価など個々の項目の分析ができるという主張が
> ありますが、SSTでも同じことができると思います。(SSTで
> 等価を行ったということは知りませんが、比較文化などの研究を
> 行うときは必要な手順になります。普通行われている研究における
> 差異が問題にされている要因では、等価は問題にならないと
> 思いますが)個々の項目の分析については、どちらも
> 共通のモデルと分析法、すなわち(階層的)一般化回帰モデルが
> 用いられているので、一方で可能なことは他方でも可能となります。
>
>  以上の理由により、現在においてもSSTは有用なテスト理論であり、
> 「古典」というラベリングで排斥されるべきものではないと
> 思っています。
>
> 横浜市在住
> 岡本安晴
>
>
>
>


--
-------------------------------------------------------
柴山 直 (SHIBAYAMA Tadashi)
東北大学大学院 教育学研究科
Tel 022-795-3738
教育設計評価専攻:http://www.sed.tohoku.ac.jp/grad/03chair/07.html
教員紹介:http://www.sed.tohoku.ac.jp/facul/05teacher/shibayama.htm
-------------------------------------------------------




スレッド表示 著者別表示 日付順表示 トップページ
["

\e$B$3$3$O\e(B\e$B?4M}3X8&5f$N4pAC%a!<%j%s%0%j%9%H\e(B\e$B$KEj9F$5$l$?2a5n$N5-;v$r7G:\\$7$F$$$k%Z!<%8$G$9!#\e(B

\n", "\n"]