[fpr 2502] SEMによる項目反応理論について

Masafumi Kirino

桐野@岡山県立大学大学院と申します。

室橋さま、荘島さま、ご返答いただきありがとうございます。
今回、2つのメッセージを投稿するのも何ですので、
お二方のご返答をひとつにまとめさせていただきました。
何卒、ご了承ください。


室橋さま>

> 桐野さんの投稿のうち、まずは2値データの場合ですが、
> 2母数正規累積モデルでは困難度の高低と正答確率の高低とが
> 逆転する可能性がある、というのはご指摘の通りだと思います。
> よって困難度の大小が完全な項目の難易度の
> 順序関係の表現になっていないのは確かなのですが、
> それでも困難度母数はある程度の目安には
> なるのではないか、と考えています。

そうですね。私もそう考えております。


> 例えば困難度が0.0の項目と0.1の項目とでは、
> 正答確率の逆転が起こっても不思議ではありません。
> しかし、困難度が0.0の項目と1.0の項目とでは、
> よほど極端な識別力でもない限り、正答確率の逆転は起きないはずです。
> これを踏まえて、項目同士の大まかな順序関係を
> 掴むというつもりで利用するならば、困難度母数は十分に
> 項目の難易度を表す指標として利用できるのではないかと思います。
> 実際にテストの分析を2母数モデルで行った例などを見てみても、
> 困難度順にソートされた項目は、
> 大体難易度の順に並んでいるようにみえます。

確かに、困難度の大小がはっきりしている場合、
実質的に興味のあるθの範囲内では、
室橋さんのご指摘されたように正答確率の逆転は起きないと考えられます。
これは、荘島さんもご指摘くださっているとおりですね。
しかし、今回は既存のスケールを利用して、困難度を推定した結果、
困難度が非常に隣接していました。たとえば、

「X3」 -0.012、0.559
「X4」 -0.091、0.508
「X5」 -0.060、0.607
(上記項目はいずれも3件法)

となったとき、どちらがより難しい項目(回答カテゴリ)というよりは、
類似していると判断したほうが適当なようにも思えます。
そもそも、これだけ困難度が隣接しているカテゴリ
(たとえば、「X1」0.559、「X2」0.508など)間において、
実質的に問題となるθの範囲内で困難度の逆転が起きない、
と仮定するほうが難しいような気もしてきました。
つまり、完全な階層関係を認めることは難しそうですね。


> まず項目内での各カテゴリ間の困難度の比較ですが、
> これを行うのは理論的にあまり意味がないように思えます。
> というのも、段階反応モデルは
> 「カテゴリ間に順序関係が存在している」ことを
> そもそもの前提として構築されているモデルだからです。
> よって、段階反応モデルをあてはめている時点で、
> カテゴリ1はカテゴリ0よりも難しいに決まっていることになります。
> カテゴリ間の困難度の順序関係を分析したい場合には、
> 名義反応モデルや多肢選択モデルを利用するほうが
> 適しているのではないでしょうか。

そうですね。確かにそのとおりです。
項目間では順序性があることが大前提ですから、カテゴリ間だけでは
比較することに大きなメリットはないかもしれません。
ただ、順序尺度で構成される多値データは、カテゴリ間の等間隔性が
保証されませんから、その間隔がどの程度離れているのかに興味がありました。
名義反応モデルや多肢選択モデルについては、検討してみたいと思います。


> 次に項目間での困難度母数の比較ですが、
> これは複雑な問題になるような気がします。
> 桐野さんがメールで述べられている方法は、
> 項目間で識別力に等値制約をおいた、
> ラッシュモデル的な段階反応モデルというようなものと理解したのですが、
> 段階反応モデルの場合、これだけでは
> カテゴリ特性曲線の形状を固定することはできないはずです。
> 何故なら、段階反応モデルの各カテゴリの曲線の形状には、
> 識別力母数の他に、隣のカテゴリの位置との兼ね合いも関係しているからです。
(中略)
> 結局、段階反応モデルでは母数を一義的に解釈することが難しいので、
> 項目間での難易度の比較を行うならば、
>カテゴリ反応曲線を重ねて描いてみるのが
> 単純かつ効果的な手段になるのではないかというのが、自分の結論です。
> また、自分は利用したことがないので不確かな発言になってしまうのですが、
> 改良段階反応モデルでは項目ごとに1つのbしか推定しないので、
> 多肢選択形式である項目間での困難度の比較を行いたい場合には、
> そちらを利用するのも1つの手段ではないかと思います。
> 改良段階反応モデルのアプローチは、上で述べた
> 「閾値の間隔を項目間で等しくする」というものに近かったはずです。

非常に難しい問題です・・・。正直、そこまでは考えておりませんでした。
最も適切な方法としてはカテゴリ反応曲線を描画することかもしれませんね。
識別力を等値に制約しても、結局は反応曲線の傾きが等しくなるだけですから、
特性曲線の形状はやはり1つ1つ異なるのですね。
改良段階反応モデルについては、初めてお聞きしました。
まだ、自分自身で理解できないないというのが本音ですが、
やはり解析方法の間違いはなるべく「ない」のが理想ですので、
極力ミスを少なくできるように、今後とも勉強していきたいと思います。
本当によい助言をいただき、ありがとうございます。



荘島さま>

> 2母数モデルでは,θの(-∞,∞)という領域のどこかで「必ず」ICCが交差しま
す.
> ただし,実質科学的に問題となるθの領域は大きく見積もっても[-5,5]くらいで
しょう
> から(垂直的な等化をしていくと,問題とすべき領域がどんどん広がっていく可能
性
> がありますが),室橋さんがおっしゃったように,ICCが当該領域で交差しない項
目
> もたくさんあります.
>
> それと,1母数と2母数モデルにおいては,位置母数(困難度母数)は,
> 「当該項目に50%の確率で正答するθの位置」
> です.ですから,位置母数は,オーバーオールな項目の難しさというよりも,
> 正答/誤答がフィフティー・フィフティー・チャンスになる点という意味での
> 困難度を与えるものです.
>
> ですから,その限りにおいては,位置母数のみで全体的な項目の
> 難易度を推論するのは間違う可能性があります.しかしながら,
> 位置母数(困難度母数)がオーバーオールな項目難易度の良い指標
> であることは,室橋さんがおっしゃったように,その通りだと思います.

はい。非常に分かりやすい回答をありがとうございます。
位置母数(困難度)だけで、当該項目(あるいは回答)の
難易度を判断する材料にするには注意が必要ということですね。
ただし、その目安として使用する限りにおいては、
よい指標になるということが分かりました。


> 段階反応モデル(GRM)の閾値は,ほぼ
> 「当該カテゴリ以上を選択した割合と,標準正規分布を[τ,∞]の
> 区間で積分した値が等しくなるような,そんなτ」です.
>
> また,GRMのカテゴリ位置母数の解釈は,
> 「当該カテゴリ以上を選択する確率が50%となるθの値」
> です.
>
> ですから,スロープ母数(識別力)が等しくても等しくなくても
> (1母数モデルであろうと2母数モデルであろうと)
> 上の定義からはみ出ない限りにおいては,どの項目間でも
> 項目内の閾値も位置母数も比較可能であろうと考えます.

段階反応モデルにおける位置母数(困難度)は
「当該カテゴリ以上を選択する確率が50%となるθの値」ということですが、
「0」「1」「2」「3」で測定された4件法の場合で、困難度(K-1)の推定値が

「X6」 -0.307、0.257、0.527

であったとき、θ=-0.307であれば、
「1」「2」「3」のいずれか(「1」以上)を選択する確率が50%、
「0」を選択する確率が50%ということになると解釈できます。
同様に、θ=0.257であれば、
「2」「3」のいずれか(「2」以上)を選択する確率が50%、
「0」「1」のいずれか(「1」以下)を選択する確率が50%と解釈できます。
最後に、θ=0.527であれば、
「3」を選択する確率が50%、「0」「1」「2」(「2」以下)を選択する確率が
50%と解釈できます。

これを前提にしますと、位置母数の持つ意味は同じですので、

「X6」 -0.307、0.257、0.527
「X7」 -0.132、0.580

と位置母数が推定されれば、「X6」におけるb3=0.527という推定値と
「X7」におけるb2=0.580を比較することができるということになります。
すなわち、「X6」のb3よりも「X7」のb2のほうが難しいと判断されることになりま
す。
しかし、これは位置母数としては比較可能であるといった限界を
有していると考えてよろしいでしょうか?
といいますのは、
位置母数は「当該カテゴリ以上を選択する確率が50%となるθの値」ですので、
カテゴリ反応曲線として表記すると、
実質的に意味のあるθの範囲内で難易度が逆転する可能性はあると思います。
つまり、反応確率が50%の時点であるという条件下に限り、
その難易度は比較検討できるけれども、
それが70%の時点では(実際には反応曲線を描くと思いますが・・・)
難易度が逆転していることも想定されると思います。
そのため、荘島さんがおっしゃられるとおり、

> です.ですから,位置母数は,オーバーオールな項目の難しさというよりも,
> 正答/誤答がフィフティー・フィフティー・チャンスになる点という意味での
> 困難度を与えるものです.

あくまでも目安であって、全体的な評価はしないほうがよい、
と判断したほうがいいということになると思います。


> また,桐野さんがおっしゃるように,K-1個だけ推定された
> 位置母数を,K個の位置母数に変換しても,同様に比較可能です.
> そのとき,中間のカテゴリの位置母数の解釈は,2母数モデルのとき
> 「当該カテゴリを選択する最も大きな確率を与えるθの値」
> ということになります.これも,この位置母数のもつ意味を外れない
> 限りにおいては,どの項目間,項目内の位置母数とも比較可能で
> あろうと思われます.

はい。K-1個ではなくK個にした場合においても、上記と同様に比較できるということ
ですね。
K個の場合と、K-1個の場合、
個人的には何か意味が異なってしまうような気もするのですが、
位置母数の意味を外れなければ比較できるということが分かりました。

繰り返しになりますが、本当によい助言をいただきありがとうございます。
今後、さらに勉強して、納得できるように頑張りたいと思います。


非常に長文となってしまいましたが、
最後まで目を通していただき、ありがとうございました。



スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。