[fpr 3762] 不適切な呼称「古典テスト=?UTF-8?B?55CG6KuW44CN?=

SHIBAYAMA, Tadashi
岡本さん

　くわしい背景説明をありがとうございました。

ーーー柴山＠東北大


On 2016/04/08 17:22, Yasuharu Okamoto wrote:
> 柴山さん。
>
> 　岡本のRe-mailです。
>
> ＞１）古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使
> ＞われています。
> ＞「古典」という名称で排除されているわけではありません。
>
> 　「CTTは時代遅れの理論でだめで、IRTを使いなさい。」
> という意見を見聞きしていますので、投稿メールを書いてみた次第です。
>
> ＞２）古典的テスト理論とIRTは、モデルがそもそも違います。
>
>  理論とモデルの区別をする必要があります。理論は異なります。
> しかし、用いられているモデルは、最近の研究では共通している場合が
> 多いです。順序カテゴリ項目を扱う場合は、そうなります。もっとも、
> CTTでは連続値をとる項目を扱うのが伝統的説明ですが、これはIRTでは
> 対象とされていません。理論は違いますが、CTTで順序カテゴリ項目を
> 扱う場合は、使われるモデルは同じタイプになっています。
> サーストンタイプと呼ばれているものです。
> 心理尺度は、普通、順序カテゴリ項目ですので、そのことを扱う場合は、
> CTTの場合もIRTと同様のモデルが用いられます。
>
> ＞３）等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー
> ＞です。
>
> 　IRTとCTTで使われている分析手法に時代差はないのではということの
> 説明に、現代のCTT理論における順序カテゴリ項目を扱うモデルでは、
> 例えば「等価」も扱えるのではということで持ち出しました。CTTでも、
> 等価を問題にしうるという意味です。順序カテゴリ項目を扱うCTTと
> IRT（３カテゴリ以上の項目の場合も含みます）では、用いられるモデルは
> 同じ種類と思われます。
>
> 岡本
>
> -----Original Message-----
> From: SHIBAYAMA, Tadashi [mailto:sibayama (at) sed.tohoku.ac.jp]
> Sent: Friday, April 8, 2016 2:49 PM
> To: fpr ML <fpr (at) psy.chubu.ac.jp>
> Subject: [fpr 3760] Re: [fpr 3759] 不適切な呼称「古典テスト理論」
>
> 岡本さん
>
> 　柴山＠東北大です。ご指摘の3点ですが、
>
> １）古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使
> われています。
> 「古典」という名称で排除されているわけではありません。
>
> ２）古典的テスト理論とIRTは、モデルがそもそも違います。
>
> ３）等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー
> です。
>
> ご参考まで。
>
> ---柴山
>
> On 2016/04/08 14:27, Yasuharu Okamoto wrote:
>> 　岡本＠日本女子大学心理学科です。
>>
>> 心理学研究において最もよく用いられている尺度作成の理論は
>> 古典テスト理論（Classical Test Theory: CTT）と呼ばれています。
>> Spearman (1904）に始まるとされていますので、古典と呼ばれるに
>> ふさわしいと思われます。これに対して現代テスト理論の１つに
>> 項目反応理論（Item Response Theory: IRT）が挙げられています。
>> IRTが現代的とされたとき、古典テスト理論という呼び方には違和感を
>> 覚えます。古典テスト理論は現在心理学研究においてもっとも
>> 使われている方法であり、現在も研究されている方法だからです。
>> 以後、このメールでは、誤解を避けるため、古典テスト理論と呼ばずに
>> 項目和テスト理論（Sum of item Scores Theory: SST）と呼ぶことにします。
>> SSTもIRTも、現在では共通の統計モデル、（階層的）一般化回帰モデル
>> が用いられ、分析法も同じ類のものが使われています。したがって、
>> 研究における統計学的手法は現時点では違いがないということに
>> なります。しかし、心理学における実証的研究のツールという
>> 観点からは、以下の違いが挙げられます。
>>
>> 　IRTでは、項目パラメタ値が与えられたテスト項目に対して、
>> ある個人の能力値は反応パターンからの推定値であり、項目数が
>> 少ないときは能力値の推定が不安定になります。個人の
>> 反応パターンから能力値の推定を行うプログラム例は
>> http://mcn-www.jwu.ac.jp/~yokamoto/books/pm/estability/
>> に挙げてありますので、参考にして下さい。
>> また、点推定値は推定法に依存して異なります。。
>> 　これに対してSSTでは、測定値は、項目和という観測データから
>> 直接一意に与えらえれる数値です。
>> 　心理尺度は、当該の実証研究の目的に応じてその研究内で
>> 開発される（先行研究の結果が確認される）ことが多く、
>> データ数がIRTによる分析が可能であるほど多くはないのが
>> 普通です。SSTでは、一応安定した因子分析が可能であれば
>> （因子構造がきれいな場合はサンプル数は少なくてよい；
>> cf. Thompson,2004, Exploratory and Confirmatory Factor Analysis,
>> p.24）分析できるので、通常の実証的心理学研究に
>> おいては、SSTはIRTより現実的分析法であると思います。
>>
>> 　IRTでは、等価など個々の項目の分析ができるという主張が
>> ありますが、SSTでも同じことができると思います。（SSTで
>> 等価を行ったということは知りませんが、比較文化などの研究を
>> 行うときは必要な手順になります。普通行われている研究における
>> 差異が問題にされている要因では、等価は問題にならないと
>> 思いますが）個々の項目の分析については、どちらも
>> 共通のモデルと分析法、すなわち（階層的）一般化回帰モデルが
>> 用いられているので、一方で可能なことは他方でも可能となります。
>>
>> 　以上の理由により、現在においてもSSTは有用なテスト理論であり、
>> 「古典」というラベリングで排斥されるべきものではないと
>> 思っています。
>>
>> 横浜市在住
>> 岡本安晴
>>
>>
>>
>>
>
> --
> -------------------------------------------------------
> 柴山　直 (SHIBAYAMA　Tadashi)
> 東北大学大学院　教育学研究科
> Tel 022-795-3738
> 教育設計評価専攻：http://www.sed.tohoku.ac.jp/grad/03chair/07.html
> 教員紹介：http://www.sed.tohoku.ac.jp/facul/05teacher/shibayama.htm
> -------------------------------------------------------
>
>
>
>


-- 
-------------------------------------------------------
柴山　直 (SHIBAYAMA　Tadashi)
東北大学大学院　教育学研究科　
Tel 022-795-3738
教育設計評価専攻：http://www.sed.tohoku.ac.jp/grad/03chair/07.html
教員紹介：http://www.sed.tohoku.ac.jp/facul/05teacher/shibayama.htm
-------------------------------------------------------
スレッド表示著者別表示日付順表示トップページ
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。