すみません,教えてください。 今,以下のような状況を想定します。 中学生で,付き合っている人がいるかいないかを 学年,性別,そして,学校内での人気,の3つの要因で 予測するモデルを作りたいとします。 その場合,「付き合っている人がいる」が,1, 「付き合っている人がいない」が,0,で従属変数(y) を構成し, 学年要因は「2年生」かどうか(2年生なら1,それ以外,0) 「3年生」かどうか,(3年生なら1,それ以外,0) の2つのダミー変数(x1とx2)で, 性別要因は{男なら1,女なら0)の1つのダミー変数(x3)で, そして,学校内での人気は,何らかの方法で測った人気の度合い が,連続変量(x4)で表されているとします。 そして,興味の中心は,「付き合っている人がいる生徒」の 割合は,学年によって違ってくるかどうか, そして違いがあるとしたらどの学年と どの学年に違いがあるか,を検討することだとします。 通常,従属変数yが連続変量の場合は, y=b0+b1*x1+b2*x2+b3*x3+b4*x4のモデル(1)と y=b0+ +b3*x3+b4*x4のモデル(2)とで 説明力を比較し,学年の情報を加えることで説明力が上がるかどうかを検討し, 説明力が上がることを確認した上で,モデル(1)のSSEを元にMSEを計算し, それを使って,たとえばTukeyの多重比較で学年間の平均値差を検討するという 手順になると思います。(もしこの段階で私の理解が間違っていたら どうぞそのことも指摘し,正しい方法を教えてください。) 今回のように,従属変数が2値で,多重ロジスティック回帰をつかうような場合, 分析の第2段階にあたる多重比較の部分はどのようにしたらよいのでしょう。 第1ステップとして,モデル(1)とモデル(2)を比較をすべきだということは 分かります。が,そこで学年の情報をモデルに組み込んだほうがよいという結果が 出たとき,では,どの学年間に「付き合っている人がいる生徒」の比率の差があると 言えるのかを検討する方法が知りたいです。 どうぞよろしくご教示ください。お願いします。 三好
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。