柴山さん。 岡本のRe-mailです。 >1)古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使 >われています。 >「古典」という名称で排除されているわけではありません。 「CTTは時代遅れの理論でだめで、IRTを使いなさい。」 という意見を見聞きしていますので、投稿メールを書いてみた次第です。 >2)古典的テスト理論とIRTは、モデルがそもそも違います。 理論とモデルの区別をする必要があります。理論は異なります。 しかし、用いられているモデルは、最近の研究では共通している場合が 多いです。順序カテゴリ項目を扱う場合は、そうなります。もっとも、 CTTでは連続値をとる項目を扱うのが伝統的説明ですが、これはIRTでは 対象とされていません。理論は違いますが、CTTで順序カテゴリ項目を 扱う場合は、使われるモデルは同じタイプになっています。 サーストンタイプと呼ばれているものです。 心理尺度は、普通、順序カテゴリ項目ですので、そのことを扱う場合は、 CTTの場合もIRTと同様のモデルが用いられます。 >3)等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー >です。 IRTとCTTで使われている分析手法に時代差はないのではということの 説明に、現代のCTT理論における順序カテゴリ項目を扱うモデルでは、 例えば「等価」も扱えるのではということで持ち出しました。CTTでも、 等価を問題にしうるという意味です。順序カテゴリ項目を扱うCTTと IRT(3カテゴリ以上の項目の場合も含みます)では、用いられるモデルは 同じ種類と思われます。 岡本 -----Original Message----- From: SHIBAYAMA, Tadashi [mailto:sibayama (at) sed.tohoku.ac.jp] Sent: Friday, April 8, 2016 2:49 PM To: fpr ML <fpr (at) psy.chubu.ac.jp> Subject: [fpr 3760] Re: [fpr 3759] 不適切な呼称「古典テスト理論」 岡本さん 柴山@東北大です。ご指摘の3点ですが、 1)古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使 われています。 「古典」という名称で排除されているわけではありません。 2)古典的テスト理論とIRTは、モデルがそもそも違います。 3)等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー です。 ご参考まで。 ---柴山 On 2016/04/08 14:27, Yasuharu Okamoto wrote: > 岡本@日本女子大学心理学科です。 > > 心理学研究において最もよく用いられている尺度作成の理論は > 古典テスト理論(Classical Test Theory: CTT)と呼ばれています。 > Spearman (1904)に始まるとされていますので、古典と呼ばれるに > ふさわしいと思われます。これに対して現代テスト理論の1つに > 項目反応理論(Item Response Theory: IRT)が挙げられています。 > IRTが現代的とされたとき、古典テスト理論という呼び方には違和感を > 覚えます。古典テスト理論は現在心理学研究においてもっとも > 使われている方法であり、現在も研究されている方法だからです。 > 以後、このメールでは、誤解を避けるため、古典テスト理論と呼ばずに > 項目和テスト理論(Sum of item Scores Theory: SST)と呼ぶことにします。 > SSTもIRTも、現在では共通の統計モデル、(階層的)一般化回帰モデル > が用いられ、分析法も同じ類のものが使われています。したがって、 > 研究における統計学的手法は現時点では違いがないということに > なります。しかし、心理学における実証的研究のツールという > 観点からは、以下の違いが挙げられます。 > > IRTでは、項目パラメタ値が与えられたテスト項目に対して、 > ある個人の能力値は反応パターンからの推定値であり、項目数が > 少ないときは能力値の推定が不安定になります。個人の > 反応パターンから能力値の推定を行うプログラム例は > http://mcn-www.jwu.ac.jp/~yokamoto/books/pm/estability/ > に挙げてありますので、参考にして下さい。 > また、点推定値は推定法に依存して異なります。。 > これに対してSSTでは、測定値は、項目和という観測データから > 直接一意に与えらえれる数値です。 > 心理尺度は、当該の実証研究の目的に応じてその研究内で > 開発される(先行研究の結果が確認される)ことが多く、 > データ数がIRTによる分析が可能であるほど多くはないのが > 普通です。SSTでは、一応安定した因子分析が可能であれば > (因子構造がきれいな場合はサンプル数は少なくてよい; > cf. Thompson,2004, Exploratory and Confirmatory Factor Analysis, > p.24)分析できるので、通常の実証的心理学研究に > おいては、SSTはIRTより現実的分析法であると思います。 > > IRTでは、等価など個々の項目の分析ができるという主張が > ありますが、SSTでも同じことができると思います。(SSTで > 等価を行ったということは知りませんが、比較文化などの研究を > 行うときは必要な手順になります。普通行われている研究における > 差異が問題にされている要因では、等価は問題にならないと > 思いますが)個々の項目の分析については、どちらも > 共通のモデルと分析法、すなわち(階層的)一般化回帰モデルが > 用いられているので、一方で可能なことは他方でも可能となります。 > > 以上の理由により、現在においてもSSTは有用なテスト理論であり、 > 「古典」というラベリングで排斥されるべきものではないと > 思っています。 > > 横浜市在住 > 岡本安晴 > > > > -- ------------------------------------------------------- 柴山 直 (SHIBAYAMA Tadashi) 東北大学大学院 教育学研究科 Tel 022-795-3738 教育設計評価専攻:http://www.sed.tohoku.ac.jp/grad/03chair/07.html 教員紹介:http://www.sed.tohoku.ac.jp/facul/05teacher/shibayama.htm -------------------------------------------------------
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。