柴山@新潟大学です。 豊田さんの > 現実問題として4項目とか5項目で1つのIRTの尺度ということ > になるとピークレベルのテスト情報量の逆数の平方根(最小の標準誤差) > も相当に大きくなって各被験者の処遇を云々することはとてもできません. > 1つの論文でIRTの別個の小さな尺度が20も提案されている,というのは > 奇異な感じもするのですが,如何でしょうか? につきまして、数理的な難しいことは良くわかりませんが、たとえば、 「多肢選択項目3個からなる数学のテストがあって、100名ほどの被験 者から得られたデータからクロンバックのアルファ係数を求めると0.75、 さらに、しかるべきソフトウェアを利用して項目パラメタも求めること ができる。したがってこの「数学」尺度によって測定した心理学的特性 を利用しながら以下の研究を進める。」というような状況を考えると、 やはり豊田さんと同じく直感的に「奇異な」感じがします。 実際、このような状況は「教育心理学研究」や「臨床心理学研究」など を読んでいますと、時々みかけます。おそらく、これも豊田さんがご指摘 のように、信頼性が見掛け上高いということで審査を通ったのだと推測 できます。しかしながら、(あくまでも個人的主観的な判断ですが)、この ような項目の内容を詳しく検討してみますと、互いにかなり似通った内容 になっていることが多いようです。言い換えれば、項目内容が互いに冗長 になっていることにより、項目間相関が高くなり、結果として高い信頼性 が推定値として得られる現象が起こっていると考えられます。 したがいまして、いずれのモデル(古典的テスト理論、因子分析モデル、 IRT、ある意味でそれらを包含するモデルとしての共分散構造分析モデル)を 使うにしても、その尺度をもってそれ以降のデータの精度を保証したいのなら、 ある程度の項目数とターゲットとする母集団からのある程度の大きさを持つ 偏りのないサンプルによってその尺度の信頼性を担保しておくことが基本に なるのではないでしょうか。 実際、IRTモデルを利用する場合を考えてみますと、1)推定すべき項目 パラメタの数はいくつなのか、2)段階モデルなのか、3)個人パラメタを 推定するのか、4)ミッション・クリティカルな場面での適用なのか、 5)推定アルゴリズムは何を利用するのか、などなどいろいろな条件を 考慮にいれて判断する必要があり、一概にはなんとも言えません。 しかし、先行研究などでは(確かLordやSwaminathan& Gifford)、基本的な2パラメタモデルで同時推定なら項目数は数百、 被験者数は数千のオーダー、個人パラメタを周辺化して項目パラメタ のみの推定に落しても、項目数は最低15ぐらいだったように記憶 しています。自分でシミュレーションしてもそうでした。また、少し 手前みそになり恐縮ですが、以前、芝式語彙理解力尺度を利用して 適応型テストを試作したときの結果(教心研1987,pp.363-7)でも、 ある個人に最適なパラメタの推定値を得るためには最低20数個の 項目が必要でした。パソコンを利用してある個人に最適化した項目を 提示していく場面で、かつ項目パラメタは所与、しかも何度も改訂 が繰り返され、かなりのデータが蓄積されていた尺度を利用して、 この数です。ましてひとつの論文のなかで、その研究に必要な心理学的 特性を測定する尺度を得る場合には「4・5項目で一つのIRTの尺度」と いうわけにはいかないのではないでしょうか。 したがいまして、「サンプルの質とサイズに配慮して」という条件付きで、 > 現在IRTは急速に心理学の研究に普及しそうな気配ですが,査読者は > 「IRTはある程度の(数十の)項目数があってはじめて尺度として認められる」 > という立場をとるべきなのでしょうか.あるいは > 「古典的モデル同様に,4項目とか5項目で1つのIRTの尺度で構わない」 > という立場をとるべきなのでしょうか.みなさんはどう思われますか? につきましては前者の立場です。ただ、 「なぜわざわざIRTモデル使う必要があるのだろうか。それよりも古典的 テスト理論モデルで話をする方がわかりやすいのに...」 という基本的な疑問は解消されないままですが。 -- ====================================================================== 新潟大学教育人間科学部 柴山 直 950-2181 新潟市五十嵐2の町8050 E-mail:sibayama (at) ed.niigata-u.ac.jp/Tel:025-262-7249/Fax:025-262-7304 ======================================================================
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。