[fpr 2269] 4・5項目で1つのIRTの尺度

豊田秀樹

豊田秀樹@早稲田心理です

FPRの皆様

古典的テストモデルを用いて尺度構成をする場合に,まず数十項目
の質問に回答してもらい,次に因子分析をして単純構造を探し,
そして各因子に負荷の高い項目をひとまとまりにして,尺度を作る
という研究手続きを踏む事がしばしばあります.

このような方法だと4項目とか5項目で(場合によっては3項目で)
1つの尺度が作られることがあります.アルファ係数はそれなりに
高く(0.7とか0.8とかに)なりますので査読には通るのですが,こ
ういう尺度は以後現場で使われなく可能性が極端に高いのも事実です.

少数項目による尺度は集団差を研究するのには向いているので,
基礎研究には便利だから,私も,自分が査読者になったときには,
修正要求はしません.しかし少数項目による尺度は各被験者の処遇
を云々することは不安があるので,現場ではまず使われません.
だから本心では空しさもあるし,修正要求したい気持ちもあります.

ここから皆さんへの相談です.最近,尺度構成に項目反応理論を
使う事が,我が国でも増えてきました.そのやり方として従来の
方法との折衷があります.つまりまず数十項目の質問に回答して
もらい,次に因子分析をして単純構造を探し,そして各因子に負
荷の高い項目をひとまとまりにして,まとまりごとに項目母数の
推定をする,というやり方です.このような方法だと4項目とか
5項目で1つのIRTの尺度ということになります.投稿者は,古
典的なやり方の母数の推定をIRTに置き換えたという認識です.

これまでは,芝式語彙検査や,服部式語彙検査のように,大きな
項目プールを作ることがやり方の標準でしたし,トフルやSAT
のような尺度は沢山の項目が背後にあって,はじめて尺度と呼べ
ていました.IRTは項目がたくさんあってはじめてその真価
が発揮され,使用の醍醐味があります.

現実問題として4項目とか5項目で1つのIRTの尺度ということ
になるとピークレベルのテスト情報量の逆数の平方根(最小の標準誤差)
も相当に大きくなって各被験者の処遇を云々することはとてもできません.
1つの論文でIRTの別個の小さな尺度が20も提案されている,というのは
奇異な感じもするのですが,如何でしょうか?
現在IRTは急速に心理学の研究に普及しそうな気配ですが,査読者は
「IRTはある程度の(数十の)項目数があってはじめて尺度として認められる」
という立場をとるべきなのでしょうか.あるいは
「古典的モデル同様に,4項目とか5項目で1つのIRTの尺度で構わない」
という立場をとるべきなのでしょうか.みなさんはどう思われますか?

10年ほど前にはSEMの査読に関して一人で悩む事が多かったし,初期の
査読結果・査読方針は,研究の決まり手筋を構成する際に驚くほど後まで
影響してしまいます.それだけに普及初期の査読は恐いのです.
IRTは我が国で今ちょうど増加の途中にあるようで,査読に慎重になる必要があ
ると思います.上記後者の立場は,ここ数年で見られる研究スタイルなので
方法論として認めてしまって良いものか否か,是非,忌憚のないご意見が
もらえればと思います.


--
メールアドレスが変更になりました.
--------------------------------------------------------------------------
 TOYODA Hideki Ph.D.,  Professor,                Department of Psychology
 TEL +81-3-5286-3567             School of Lieterature, Waseda University
 toyoda (at) waseda.jp        1-24-1 Toyama Shinjyuku-ku, Tokyo 162-8644 Japan
 http://www.littera.waseda.ac.jp/faculty/tyosem/index.html
--------------------------------------------------------------------------

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。