[fpr 3762] 不適切な呼称「古典テスト=?UTF-8?B?55CG6KuW44CN?=

SHIBAYAMA, Tadashi

岡本さん

 くわしい背景説明をありがとうございました。

ーーー柴山@東北大


On 2016/04/08 17:22, Yasuharu Okamoto wrote:
> 柴山さん。
>
>  岡本のRe-mailです。
>
> >1)古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使
> >われています。
> >「古典」という名称で排除されているわけではありません。
>
>  「CTTは時代遅れの理論でだめで、IRTを使いなさい。」
> という意見を見聞きしていますので、投稿メールを書いてみた次第です。
>
> >2)古典的テスト理論とIRTは、モデルがそもそも違います。
>
>  理論とモデルの区別をする必要があります。理論は異なります。
> しかし、用いられているモデルは、最近の研究では共通している場合が
> 多いです。順序カテゴリ項目を扱う場合は、そうなります。もっとも、
> CTTでは連続値をとる項目を扱うのが伝統的説明ですが、これはIRTでは
> 対象とされていません。理論は違いますが、CTTで順序カテゴリ項目を
> 扱う場合は、使われるモデルは同じタイプになっています。
> サーストンタイプと呼ばれているものです。
> 心理尺度は、普通、順序カテゴリ項目ですので、そのことを扱う場合は、
> CTTの場合もIRTと同様のモデルが用いられます。
>
> >3)等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー
> >です。
>
>  IRTとCTTで使われている分析手法に時代差はないのではということの
> 説明に、現代のCTT理論における順序カテゴリ項目を扱うモデルでは、
> 例えば「等価」も扱えるのではということで持ち出しました。CTTでも、
> 等価を問題にしうるという意味です。順序カテゴリ項目を扱うCTTと
> IRT(3カテゴリ以上の項目の場合も含みます)では、用いられるモデルは
> 同じ種類と思われます。
>
> 岡本
>
> -----Original Message-----
> From: SHIBAYAMA, Tadashi [mailto:sibayama (at) sed.tohoku.ac.jp]
> Sent: Friday, April 8, 2016 2:49 PM
> To: fpr ML <fpr (at) psy.chubu.ac.jp>
> Subject: [fpr 3760] Re: [fpr 3759] 不適切な呼称「古典テスト理論」
>
> 岡本さん
>
>  柴山@東北大です。ご指摘の3点ですが、
>
> 1)古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使
> われています。
> 「古典」という名称で排除されているわけではありません。
>
> 2)古典的テスト理論とIRTは、モデルがそもそも違います。
>
> 3)等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー
> です。
>
> ご参考まで。
>
> ---柴山
>
> On 2016/04/08 14:27, Yasuharu Okamoto wrote:
>>  岡本@日本女子大学心理学科です。
>>
>> 心理学研究において最もよく用いられている尺度作成の理論は
>> 古典テスト理論(Classical Test Theory: CTT)と呼ばれています。
>> Spearman (1904)に始まるとされていますので、古典と呼ばれるに
>> ふさわしいと思われます。これに対して現代テスト理論の1つに
>> 項目反応理論(Item Response Theory: IRT)が挙げられています。
>> IRTが現代的とされたとき、古典テスト理論という呼び方には違和感を
>> 覚えます。古典テスト理論は現在心理学研究においてもっとも
>> 使われている方法であり、現在も研究されている方法だからです。
>> 以後、このメールでは、誤解を避けるため、古典テスト理論と呼ばずに
>> 項目和テスト理論(Sum of item Scores Theory: SST)と呼ぶことにします。
>> SSTもIRTも、現在では共通の統計モデル、(階層的)一般化回帰モデル
>> が用いられ、分析法も同じ類のものが使われています。したがって、
>> 研究における統計学的手法は現時点では違いがないということに
>> なります。しかし、心理学における実証的研究のツールという
>> 観点からは、以下の違いが挙げられます。
>>
>>  IRTでは、項目パラメタ値が与えられたテスト項目に対して、
>> ある個人の能力値は反応パターンからの推定値であり、項目数が
>> 少ないときは能力値の推定が不安定になります。個人の
>> 反応パターンから能力値の推定を行うプログラム例は
>> http://mcn-www.jwu.ac.jp/~yokamoto/books/pm/estability/
>> に挙げてありますので、参考にして下さい。
>> また、点推定値は推定法に依存して異なります。。
>>  これに対してSSTでは、測定値は、項目和という観測データから
>> 直接一意に与えらえれる数値です。
>>  心理尺度は、当該の実証研究の目的に応じてその研究内で
>> 開発される(先行研究の結果が確認される)ことが多く、
>> データ数がIRTによる分析が可能であるほど多くはないのが
>> 普通です。SSTでは、一応安定した因子分析が可能であれば
>> (因子構造がきれいな場合はサンプル数は少なくてよい;
>> cf. Thompson,2004, Exploratory and Confirmatory Factor Analysis,
>> p.24)分析できるので、通常の実証的心理学研究に
>> おいては、SSTはIRTより現実的分析法であると思います。
>>
>>  IRTでは、等価など個々の項目の分析ができるという主張が
>> ありますが、SSTでも同じことができると思います。(SSTで
>> 等価を行ったということは知りませんが、比較文化などの研究を
>> 行うときは必要な手順になります。普通行われている研究における
>> 差異が問題にされている要因では、等価は問題にならないと
>> 思いますが)個々の項目の分析については、どちらも
>> 共通のモデルと分析法、すなわち(階層的)一般化回帰モデルが
>> 用いられているので、一方で可能なことは他方でも可能となります。
>>
>>  以上の理由により、現在においてもSSTは有用なテスト理論であり、
>> 「古典」というラベリングで排斥されるべきものではないと
>> 思っています。
>>
>> 横浜市在住
>> 岡本安晴
>>
>>
>>
>>
>
> --
> -------------------------------------------------------
> 柴山 直 (SHIBAYAMA Tadashi)
> 東北大学大学院 教育学研究科
> Tel 022-795-3738
> 教育設計評価専攻:http://www.sed.tohoku.ac.jp/grad/03chair/07.html
> 教員紹介:http://www.sed.tohoku.ac.jp/facul/05teacher/shibayama.htm
> -------------------------------------------------------
>
>
>
>


-- 
-------------------------------------------------------
柴山 直 (SHIBAYAMA Tadashi)
東北大学大学院 教育学研究科 
Tel 022-795-3738
教育設計評価専攻:http://www.sed.tohoku.ac.jp/grad/03chair/07.html
教員紹介:http://www.sed.tohoku.ac.jp/facul/05teacher/shibayama.htm
-------------------------------------------------------



スレッド表示 著者別表示 日付順表示 トップページ
["

\e$B$3$3$O\e(B\e$B?4M}3X8&5f$N4pAC%a!<%j%s%0%j%9%H\e(B\e$B$KEj9F$5$l$?2a5n$N5-;v$r7G:\\$7$F$$$k%Z!<%8$G$9!#\e(B

\n", "\n"]