岡本さん くわしい背景説明をありがとうございました。 ーーー柴山@東北大 On 2016/04/08 17:22, Yasuharu Okamoto wrote: > 柴山さん。 > > 岡本のRe-mailです。 > > >1)古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使 > >われています。 > >「古典」という名称で排除されているわけではありません。 > > 「CTTは時代遅れの理論でだめで、IRTを使いなさい。」 > という意見を見聞きしていますので、投稿メールを書いてみた次第です。 > > >2)古典的テスト理論とIRTは、モデルがそもそも違います。 > > 理論とモデルの区別をする必要があります。理論は異なります。 > しかし、用いられているモデルは、最近の研究では共通している場合が > 多いです。順序カテゴリ項目を扱う場合は、そうなります。もっとも、 > CTTでは連続値をとる項目を扱うのが伝統的説明ですが、これはIRTでは > 対象とされていません。理論は違いますが、CTTで順序カテゴリ項目を > 扱う場合は、使われるモデルは同じタイプになっています。 > サーストンタイプと呼ばれているものです。 > 心理尺度は、普通、順序カテゴリ項目ですので、そのことを扱う場合は、 > CTTの場合もIRTと同様のモデルが用いられます。 > > >3)等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー > >です。 > > IRTとCTTで使われている分析手法に時代差はないのではということの > 説明に、現代のCTT理論における順序カテゴリ項目を扱うモデルでは、 > 例えば「等価」も扱えるのではということで持ち出しました。CTTでも、 > 等価を問題にしうるという意味です。順序カテゴリ項目を扱うCTTと > IRT(3カテゴリ以上の項目の場合も含みます)では、用いられるモデルは > 同じ種類と思われます。 > > 岡本 > > -----Original Message----- > From: SHIBAYAMA, Tadashi [mailto:sibayama (at) sed.tohoku.ac.jp] > Sent: Friday, April 8, 2016 2:49 PM > To: fpr ML <fpr (at) psy.chubu.ac.jp> > Subject: [fpr 3760] Re: [fpr 3759] 不適切な呼称「古典テスト理論」 > > 岡本さん > > 柴山@東北大です。ご指摘の3点ですが、 > > 1)古典物理学に含まれるニュートン力学はいまでも衛星探査レベルでは十分使 > われています。 > 「古典」という名称で排除されているわけではありません。 > > 2)古典的テスト理論とIRTは、モデルがそもそも違います。 > > 3)等化の概念と、古典的テスト理論モデルやIRTモデルは別の概念カテゴリー > です。 > > ご参考まで。 > > ---柴山 > > On 2016/04/08 14:27, Yasuharu Okamoto wrote: >> 岡本@日本女子大学心理学科です。 >> >> 心理学研究において最もよく用いられている尺度作成の理論は >> 古典テスト理論(Classical Test Theory: CTT)と呼ばれています。 >> Spearman (1904)に始まるとされていますので、古典と呼ばれるに >> ふさわしいと思われます。これに対して現代テスト理論の1つに >> 項目反応理論(Item Response Theory: IRT)が挙げられています。 >> IRTが現代的とされたとき、古典テスト理論という呼び方には違和感を >> 覚えます。古典テスト理論は現在心理学研究においてもっとも >> 使われている方法であり、現在も研究されている方法だからです。 >> 以後、このメールでは、誤解を避けるため、古典テスト理論と呼ばずに >> 項目和テスト理論(Sum of item Scores Theory: SST)と呼ぶことにします。 >> SSTもIRTも、現在では共通の統計モデル、(階層的)一般化回帰モデル >> が用いられ、分析法も同じ類のものが使われています。したがって、 >> 研究における統計学的手法は現時点では違いがないということに >> なります。しかし、心理学における実証的研究のツールという >> 観点からは、以下の違いが挙げられます。 >> >> IRTでは、項目パラメタ値が与えられたテスト項目に対して、 >> ある個人の能力値は反応パターンからの推定値であり、項目数が >> 少ないときは能力値の推定が不安定になります。個人の >> 反応パターンから能力値の推定を行うプログラム例は >> http://mcn-www.jwu.ac.jp/~yokamoto/books/pm/estability/ >> に挙げてありますので、参考にして下さい。 >> また、点推定値は推定法に依存して異なります。。 >> これに対してSSTでは、測定値は、項目和という観測データから >> 直接一意に与えらえれる数値です。 >> 心理尺度は、当該の実証研究の目的に応じてその研究内で >> 開発される(先行研究の結果が確認される)ことが多く、 >> データ数がIRTによる分析が可能であるほど多くはないのが >> 普通です。SSTでは、一応安定した因子分析が可能であれば >> (因子構造がきれいな場合はサンプル数は少なくてよい; >> cf. Thompson,2004, Exploratory and Confirmatory Factor Analysis, >> p.24)分析できるので、通常の実証的心理学研究に >> おいては、SSTはIRTより現実的分析法であると思います。 >> >> IRTでは、等価など個々の項目の分析ができるという主張が >> ありますが、SSTでも同じことができると思います。(SSTで >> 等価を行ったということは知りませんが、比較文化などの研究を >> 行うときは必要な手順になります。普通行われている研究における >> 差異が問題にされている要因では、等価は問題にならないと >> 思いますが)個々の項目の分析については、どちらも >> 共通のモデルと分析法、すなわち(階層的)一般化回帰モデルが >> 用いられているので、一方で可能なことは他方でも可能となります。 >> >> 以上の理由により、現在においてもSSTは有用なテスト理論であり、 >> 「古典」というラベリングで排斥されるべきものではないと >> 思っています。 >> >> 横浜市在住 >> 岡本安晴 >> >> >> >> > > -- > ------------------------------------------------------- > 柴山 直 (SHIBAYAMA Tadashi) > 東北大学大学院 教育学研究科 > Tel 022-795-3738 > 教育設計評価専攻:http://www.sed.tohoku.ac.jp/grad/03chair/07.html > 教員紹介:http://www.sed.tohoku.ac.jp/facul/05teacher/shibayama.htm > ------------------------------------------------------- > > > > -- ------------------------------------------------------- 柴山 直 (SHIBAYAMA Tadashi) 東北大学大学院 教育学研究科 Tel 022-795-3738 教育設計評価専攻:http://www.sed.tohoku.ac.jp/grad/03chair/07.html 教員紹介:http://www.sed.tohoku.ac.jp/facul/05teacher/shibayama.htm -------------------------------------------------------
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。