南風原@東大教育心理です。
> 谷口@岡山大学文学研究科M2です。
>> Q2:その比較が「相関係数の2乗(決定係数)を用いることで可能
>> であると言います」ということですが,その内容をもう少し詳しく教
>> えて下さい。
> 例えば,ピアソン相関係数が0.8である連関は同相関係数が0.4である連関
> の2倍ではない。比較をする一つの方法として相関係数の2乗(決定係数)
> を利用する方法がある。この方法を用いれば,相関係数が0.8である連関
> の決定係数は,0.64,相関係数が0.4である連関の決定係数は,0.16であ
> るので,0.8という連関は0.4という連関よりも4倍大きいものであると言
> える,と記述されています。
相関係数の値が2倍でも「連関が2倍である」とは言えないということ,決定
係数ならばそう言えるということですね。分かりました。
でも,「連関が2倍である」って何でしょうね。
(以下,教科書ふうになりますが)相関係数にはなくて,決定係数にはある性
質といえば,ある意味で「足し算ができる」ということです。変数xと変数y
の関係を調べるとき,xからyを予測(説明)する直線回帰を考えれば,xに
基づくyの予測値y’と残差(予測の誤差)eによって,yが
y=y’+e
と表されます。
このとき,y’とeが無相関になるという性質があって,そのために,yの分
散が,y’の分散とeの分散の和に等しくなります。
yの分散=y’の分散 + eの分散
この式の両辺を,左辺にあるyの分散で割ると,
1=決定係数+非決定係数
となります。
さて,「足し算ができる」ということの意味ですが,いま,先のxとはまった
く相関のない変数zがあり,さらにzとyの間の相関は,xとyの間の相関に
等しいとします。つまり,xとzは,yを予測する上で同等な変数で,かつ互
いに無相関のものです。
このxとzの両方を用いてyを予測したらどうなるか,というと,
x,zとyの重相関係数=xとyの相関係数+zとyの相関係数
=xとyの相関係数の2倍
とはなりませんが,各項を2乗した決定係数については,
x,zによる重決定係数=xによる決定係数+zによる決定係数
=xによる決定係数の2倍
となり,単純な足し算が成り立ちます。
先の「決定係数を用いれば「連関が2倍」などと言える」というのは,いま述
べたことが根拠になっていると思います。
さて,もともとのご質問は,
> Q:複数の相関係数の比較を行う場合,Pearsonの相関係数では,相関係
> 数の2乗(決定係数)を用いることで可能であると言いますが,これは
> Spearmanの順位相関係数にも当てはまるのでしょうか?
というものでした。ご存じのように,もとの変数をそれぞれ順位に置き換えて,
その上でピアソンの式を適用したものがスピアマンの相関係数ですから,順位
に変換した後の尺度については,上の議論が(数学的には)そのまま成り立ち
ます。
ただ,上の議論の出発点となった分散の分割(いわゆる分散分析)は,素デー
タの尺度を暗黙に仮定しているように思います。ですから,「スピアマンの順
位相関係数の2乗」というようなものは,私には奇異な感じがします。
====================
南風原朝和 (はえばら ともかず)
tomokazu (at) tansei.cc.u-tokyo.ac.jp
〒113 文京区本郷7-3-1 東京大学教育学部
TEL: 03-5802-3350 FAX 03-3813-8807
====================
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。