岡本@日本女子大学心理学科です。 私の周りの学生たちも、調査データに基づく因果関係の 分析に回帰モデルや構造方程式を用いる人たちが毎年 かなりいますので、回帰モデルと因果関係について日頃 気になることを簡単な数式にまとめてみました。 原因Xによって結果Yの生じることが線形回帰モデルで 表わされるとするとき、このことは次式 (1) Y = a*X + E で表わされます。ここで、EはXおよびYと独立であるとします。 このとき、(1)より導かれる次式 (2) X = (1/a)*Y + (-E/a) において、(-E/a)はYおよびXと独立なので、確率モデルとしては (1)と(2)は同じ適合度をもつはずです。しかし、現実には、Eの 独立性の仮定が成り立つことは期待できません。このときのモデルは (1a) Y = a*X + (E|X) および (2a) X = (1/a)*Y + ((-E/a)|Y) となります。残差項(E|X)はXに依存した分布を表わし、同じく ((-E/a)|Y)はYに依存した分布を表します。 モデルの適合度を見るとき、(E|X)をXと独立、あるいは ((-E/a)|YをYと独立とみなすことの影響を考える必要があります。 適合度(尤度比、AICなど)の理論がiid(independently identically distributed)に基づいているときは、モデル(1a)および(2a)の 場合は注意が必要です。高次モーメントを用いるときも、同じです。 残差の他の変数との依存性を考慮した理論を用いる必要があります。 心理学など社会系のデータは天井効果・床効果など、残差が他の 変数に依存しているものがあります。 モデル(1)と(2)の適合度の違いは、因果関係を反映しているという 解釈より、モデル(1a)と(2a)をモデル(1)と(2)で置き換えることの 影響の差と解釈することに止めておくのがよいと思います。 影響の差を因果関係の反映であると解釈するためには、 実質科学、例えば心理学における理論的考察が必要であると 思います。 日本女子大学心理学科 岡本安晴
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。