[fpr 2245] 相関係数の検定と区間推定、そして回帰係数の検定と区間推定

SHIBAYAMA Tadashi

三好さん

こんにちは、新潟大学の柴山です。

お手元にスネデカー・コクラン「統計的方法 原初第6版」
畑村・奥野・津村共訳 岩波書店があれば、p176-7を
ご覧下さい。そこに、(以下引用です)

この関係は、不可思議な問題点(=三好さんの疑問)を
提起する。bについてのt検定は、Yが正規分布する
ことだけを前提としている:Xの値は正規分布しても
良いし、研究者によって選択されたものであっても
よい。他方、rとローは、2変量正規分布からの無作為
標本であるとき、密接に関連づけられることを強調して
きた。しかしながら、ロー=0という特殊の場合には、
Yが正規分布をすると仮定できれば、Xの分布が正規型
であってもなくても、ローの分布は同じであることを、
Fisherは証明した。

とあります。そして、Fisherの論文として、

Fisher (1915) Biometrika,10:507

があげられています。こういうことは良く注意して
いないと、直感的にわかりやすいX,Yが2変量正規
分布している方を前提に話をしてしまいがちですよね。
もっともFisherの証明は難しくて読んでもわからない
だろうと、最初からあきらめて読んでいません。


> 「EBM実践のための統計学的Q&A」の第11章
> 回帰と相関の最初のページに、
> 「相関係数,rは、2連続型変数間の線形関係の
> 強さを測るものである。、、、、この検定では、
> 少なくとも1変数が正規分布に従わなければなら
> ない。回帰や相関を用いた、直線関係がないという
> 帰無仮説の検定は、数値的には等価になる。
> 相関係数の信頼区間を計算できるが、このため
> には両変数は正規分布に従わねばならない。」
> とあります。(同じような記述は、 The Lady Tasting
> Tea でも読んだ記憶があります。)
>
> さて、相関係数の検定では、1変数が正規分布して
> いればよいのに、信頼区間のためには両方とも
> 正規分布する必要があるのは、なぜなんでしょうか?
>
> 相関係数の検定のためには1変数が正規分布
> していればよいというのは、回帰分析の前提条件
> を考えればなんとなく納得がいく(たしか、「従属変数
> が正規分布し、誤差項が正規分布すれば
> 独立変数は正規分布していなくてもよい、」だった
> でしょうか)のですが、相関係数の信頼区間はなぜ、
> 同じように計算できないのでしょうか?偏回帰係数の
> 信頼区間は計算できますよね?
>
> いくつかの教科書や参考書をあたってみたの
> ですが、一般には、
> 「はじめての統計」(有斐閣ブックス)にあるように、
> 「実は、サイズがnの標本が2変数正規分布に
> 従う母集団からの無作為標本である場合に限り、
> 標本相関係数がある確率分布に従うことを導き
> だすことができます。」(p207)とし、さらに、
> 「相関係数がρの2変数正規分布に従う母集団から、
> 無作為に抽出されたn組のデータの標本相関係数
> rを、、、、、(式略)の正規分布でうまく近似できます。
> この近似によって、母集団相関係数の信頼区間の
> 設定や、さまざまなρの値に関する仮説検定が
> 可能となります」(p210)というように、
> 2変量正規分布を前提として、検定と区間推定を
> 同時に扱っているものがほとんどのようです。
>
> なぜ、日本語で書かれた教科書や参考書は、この
> ように説明するのでしょうか?
>
> このあたりのこと、できればわかりやすく
> 教えていただければ幸いです。私がなにか
> とんでもない誤解をしていなければよいと
> 思いつつ、よろしく御願いいたします。

--
======================================================================
 新潟大学教育人間科学部  柴山 直    950-2181 新潟市五十嵐2の町8050
 E-mail:sibayama (at) ed.niigata-u.ac.jp/Tel:025-262-7249/Fax:025-262-7304
======================================================================




スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。