三好さん こんにちは、新潟大学の柴山です。 お手元にスネデカー・コクラン「統計的方法 原初第6版」 畑村・奥野・津村共訳 岩波書店があれば、p176-7を ご覧下さい。そこに、(以下引用です) この関係は、不可思議な問題点(=三好さんの疑問)を 提起する。bについてのt検定は、Yが正規分布する ことだけを前提としている:Xの値は正規分布しても 良いし、研究者によって選択されたものであっても よい。他方、rとローは、2変量正規分布からの無作為 標本であるとき、密接に関連づけられることを強調して きた。しかしながら、ロー=0という特殊の場合には、 Yが正規分布をすると仮定できれば、Xの分布が正規型 であってもなくても、ローの分布は同じであることを、 Fisherは証明した。 とあります。そして、Fisherの論文として、 Fisher (1915) Biometrika,10:507 があげられています。こういうことは良く注意して いないと、直感的にわかりやすいX,Yが2変量正規 分布している方を前提に話をしてしまいがちですよね。 もっともFisherの証明は難しくて読んでもわからない だろうと、最初からあきらめて読んでいません。 > 「EBM実践のための統計学的Q&A」の第11章 > 回帰と相関の最初のページに、 > 「相関係数,rは、2連続型変数間の線形関係の > 強さを測るものである。、、、、この検定では、 > 少なくとも1変数が正規分布に従わなければなら > ない。回帰や相関を用いた、直線関係がないという > 帰無仮説の検定は、数値的には等価になる。 > 相関係数の信頼区間を計算できるが、このため > には両変数は正規分布に従わねばならない。」 > とあります。(同じような記述は、 The Lady Tasting > Tea でも読んだ記憶があります。) > > さて、相関係数の検定では、1変数が正規分布して > いればよいのに、信頼区間のためには両方とも > 正規分布する必要があるのは、なぜなんでしょうか? > > 相関係数の検定のためには1変数が正規分布 > していればよいというのは、回帰分析の前提条件 > を考えればなんとなく納得がいく(たしか、「従属変数 > が正規分布し、誤差項が正規分布すれば > 独立変数は正規分布していなくてもよい、」だった > でしょうか)のですが、相関係数の信頼区間はなぜ、 > 同じように計算できないのでしょうか?偏回帰係数の > 信頼区間は計算できますよね? > > いくつかの教科書や参考書をあたってみたの > ですが、一般には、 > 「はじめての統計」(有斐閣ブックス)にあるように、 > 「実は、サイズがnの標本が2変数正規分布に > 従う母集団からの無作為標本である場合に限り、 > 標本相関係数がある確率分布に従うことを導き > だすことができます。」(p207)とし、さらに、 > 「相関係数がρの2変数正規分布に従う母集団から、 > 無作為に抽出されたn組のデータの標本相関係数 > rを、、、、、(式略)の正規分布でうまく近似できます。 > この近似によって、母集団相関係数の信頼区間の > 設定や、さまざまなρの値に関する仮説検定が > 可能となります」(p210)というように、 > 2変量正規分布を前提として、検定と区間推定を > 同時に扱っているものがほとんどのようです。 > > なぜ、日本語で書かれた教科書や参考書は、この > ように説明するのでしょうか? > > このあたりのこと、できればわかりやすく > 教えていただければ幸いです。私がなにか > とんでもない誤解をしていなければよいと > 思いつつ、よろしく御願いいたします。 -- ====================================================================== 新潟大学教育人間科学部 柴山 直 950-2181 新潟市五十嵐2の町8050 E-mail:sibayama (at) ed.niigata-u.ac.jp/Tel:025-262-7249/Fax:025-262-7304 ======================================================================
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。