岡本安晴@日本女子大学心理学科です。 回帰式の解釈で、ある意味、困っています。 いま、データ生成モデルとして、 ある原因Ⅹにランダムな要因Eが加わって結果Yが得られたとします。 これは、 (1) Y=X+E として表されます。 データ(X、Y)が与えられたとき、Yの値をXの1次式で表してみる というのが単回帰式です。すなわち、 (2) Y=aX+b+e と書きます。式(1)はデータの生成モデルですが、 式(2)は単に数値の関係を表した数理モデルです。 式(2)において、eの2乗の期待値(平均値)を最小にするという基準で aおよびbを求めると、 a = 1 b = 0 が導かれます。すなわち、式としては、(1)と(2)は一致します。 しかし、(1)はデータ生成のモデルであり、 (2)は数値の関係を表す記述モデルである という区別は重要だと思います。 比喩的な表現として (1)はXに誤差Eをぶち込んでYが得られる という表現は可能ですが、 (2)は誤差eをぶち込んでいるのではありません。一次式 aX+b で近似したときの従属変数と一次式との差として得られるものです。 順序関係で言えば、 (1)では、Eが与えらえた後、Yが生成されます。 しかし、(2)では、aX+bとYが与えられた後に e が与えられます。 統計学に妙な意味解釈が持ち込まれていることがあると思い、 ちょっと書いてみました。 変に、意味解釈を統計の式に持ち込むと困ったことになります。 例えば、体重のデータを得て、分散を計算するとその単位は Kgの2乗になります。Kgの2乗に対応する物理的概念は何でしょうか。 経済現象でも同じです。円の2乗ってどんな経済単位でしょうか? 横浜市在住 岡本安晴
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。