柳井@大学入試センター研究開発部です 岡本さんの議論について一言コメントしたくなりました。 xとyを説明変数、zを基準変数としたとき、次式が 成立することは周知のことです。(学生への練習問題にしてください) xとzの相関係数=(xとyの相関係数)(zに対するyの 標準偏回帰係数)+(zに対するxの標準偏回帰係数) したがって、xとzの相関がゼロの場合でも、xとyの相関、zに対するyおよびxの標準偏回帰係数はゼロになる必要はありません。ただし、xとy、yとz、zとxの相関係数をそれぞれ、a,b,cとしたとき、 1+2abc-aa-bb-cc>=0 という制約はつきますが。 知能から飽きへの係数(この場合、相関係数)は0.651、飽きからエラーへの係数(0.723)、知能からエラーへの係数(−0.449)ですから、 0.651*0.723−0.449=0.057 となり、エラーと知能の相関係数0.07に近い値になります。 つまり、知能のエラーに対する直接効果(プラス)と飽きを経由する間接効果(マイナス)が相殺されて、知能とエラーの相関がゼロになることになります。 これは、xとyを説明変数ベクトルとして2次元で表示し、 2次元平面にない基準変数ベクトルzをxと90度の角度にもってくることで簡単に説明できます。(これも学生への練習問題になります) 2群の判別分析でも、判別に用いる変数xが2群でまったく平均の差がないとき、xと相関のあるyを判別分析に組み込むことにより、x、yともに有意な判別係数がえられることも、上記の原理とほぼ同等です。(柳井・岩坪(1976)、複雑さに挑む科学、の第3章にも詳述されています) 付言すれば、説明変数xと基準変数zの相関が0のとき、 第2の変数yを経由したzに対する間接効果と、zに対する直接効果の符号がことなることになり、xがzに対して 予測的妥当性(あるいは、より広く基準関連妥当性)を 持つかどうかはは議論の分かれるところでしょう。ひとつの例として、xを入試成績、zを入学後の専門分野の成績(3,4年の成績)としたとき、xとzの相関がゼロ、yを教養課程(1,2年の成績)の成績としたとき、 xとyの相関が正、yのzに対する係数が正のとき、入試成績xは専門成績zに対し、教養成績yを経由した場合は、ポジテイブな予測的妥当性をもつといってよいでしょうか。 iginal Message ----- From: "Yasuharu Okamoto" <yasuharu.okamoto (at) nifty.com> To: <fpr (at) nuis.ac.jp> Sent: Tuesday, November 23, 2004 3:28 PM Subject: [fpr 2699] Re: 短縮尺度を作る > > 議論の流れのついでなので書きました。 > > 相関係数がないときに、関係があることがある。 > 非線形の関係のときは相関係数のないことがあるのは > よく説明されていますが、これは散布図を描くとチェックできます。 > 散布図を描いてもわからない場合が、共分散構造分析の説明で > 出てきますが、この場合も十分考慮に入れておく必要があると思います。 > > >「職場のストレス判定図」と欠勤日数の相関はほぼゼロ。 > >ストレスと欠勤日数が無関係なら、 > > 上の場合が該当しているかどうかは別にして、一般論として、ついでに > (というか、授業用に作成したデータがあるので)書いておきます。 > > Bollenの本に出ていたので、シミュレーションでデータを作ってみたのが、 > 添付のファイルです。「知能」、「エラー」、「飽き」の3変数のデータで、 > 「知能」と「エラー」の相関は、0.072でp値は30%です。相関はなく、 > 散布図を見ても特に非線形の関係は認められません。しかし、第3の変数 > 「飽き」(飽きた度合いを表す)の変数を入れてパスを > > 「エラー」 <− 「知能」 > 「エラー」 <− 「飽き」 > 「飽き」 <ー 「知能」 > > と引くと、係数は > > 「エラー」 <− 「知能」 −0.449 (検定統計量 z=−8.599) > > 「エラー」 <− 「飽き」 0.651 (検定統計量 z=9.553) > 「飽き」 <− 「知能」 0.723 (検定統計量 z=40.037) > > > となっています。 > すなわち、相関係数では有意な関係は認められなかったが、第3の変数を > 入れたパス図では、有意な関係が認められたとなっています。 > > 日本女子大学心理学科 > 岡本安晴 > > > > >
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。