すみません、どなたか教えていただけませんか。 「EBM実践のための統計学的Q&A」の第11章 回帰と相関の最初のページに、 「相関係数,rは、2連続型変数間の線形関係の 強さを測るものである。、、、、この検定では、 少なくとも1変数が正規分布に従わなければなら ない。回帰や相関を用いた、直線関係がないという 帰無仮説の検定は、数値的には等価になる。 相関係数の信頼区間を計算できるが、このため には両変数は正規分布に従わねばならない。」 とあります。(同じような記述は、 The Lady Tasting Tea でも読んだ記憶があります。) さて、相関係数の検定では、1変数が正規分布して いればよいのに、信頼区間のためには両方とも 正規分布する必要があるのは、なぜなんでしょうか? 相関係数の検定のためには1変数が正規分布 していればよいというのは、回帰分析の前提条件 を考えればなんとなく納得がいく(たしか、「従属変数 が正規分布し、誤差項が正規分布すれば 独立変数は正規分布していなくてもよい、」だった でしょうか)のですが、相関係数の信頼区間はなぜ、 同じように計算できないのでしょうか?偏回帰係数の 信頼区間は計算できますよね? いくつかの教科書や参考書をあたってみたの ですが、一般には、 「はじめての統計」(有斐閣ブックス)にあるように、 「実は、サイズがnの標本が2変数正規分布に 従う母集団からの無作為標本である場合に限り、 標本相関係数がある確率分布に従うことを導き だすことができます。」(p207)とし、さらに、 「相関係数がρの2変数正規分布に従う母集団から、 無作為に抽出されたn組のデータの標本相関係数 rを、、、、、(式略)の正規分布でうまく近似できます。 この近似によって、母集団相関係数の信頼区間の 設定や、さまざまなρの値に関する仮説検定が 可能となります」(p210)というように、 2変量正規分布を前提として、検定と区間推定を 同時に扱っているものがほとんどのようです。 なぜ、日本語で書かれた教科書や参考書は、この ように説明するのでしょうか? このあたりのこと、できればわかりやすく 教えていただければ幸いです。私がなにか とんでもない誤解をしていなければよいと 思いつつ、よろしく御願いいたします。 敬具 --------------------------- Hiroto Miyoshi (三好弘人) h_m_ (at) po.harenet.ne.jp
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。