[fpr 2246] 相関係数の検定と区間推定、そして回帰係数の検定と区間推定

狩野裕

狩野@大阪大学です

優秀な学生から発せられるFAQではないでしょうか.

偏回帰係数=0や母相関係数=0の検定統計量の分布の
導出では,xを与えた下でのyの条件付分布を考えます.
その条件の下で,検定統計量の分布がt-分布になることを
導きます.t-分布は与えたxの値に依存しないことから,条件を
外しても同じ分布と考えてよいという結論が得られます.
つまり,「xを与えた下でのyの条件付分布」が重要で,xの分布
自体は何でもよいということなのです.

多変量解析ではスタンダードな理論展開で,理論的な教科書には
必ず出ています.

この結果があるから,回帰分析の一般論は,xを固定変数として
理論展開できるのです.xとyが身長,体重という場合に,身長は
固定変数,体重は正規分布としてよい理由がここにあります.

SEMでも,性別などの属性変数は,独立変数として用いるのならば
「罪は重くない」ということなのですが,その理論的根拠も同じところ
にあります.

なお,信頼区間では母相関係数はゼロとは限りませんから,
上記の議論は使えません.検定の場合は帰無仮説のもとでの
分布を考えますから母相関係数はゼロとなります.

○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○
 狩野  裕 大阪大学人間科学部
 〒565-0871 吹田市山田丘1−2  Phone/Fax:06-6879-8052
 http://koko15.hus.osaka-u.ac.jp/~kano/
 You can get pdf files of the current articles of Behaviormetrika.
 Visit http://wwwsoc.nii.ac.jp/bsj/behaviormetrika_index.html
●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●



> 三好さん
> 
> こんにちは、新潟大学の柴山です。
> 
> お手元にスネデカー・コクラン「統計的方法 原初第6版」
> 畑村・奥野・津村共訳 岩波書店があれば、p176-7を
> ご覧下さい。そこに、(以下引用です)
> 
> この関係は、不可思議な問題点(=三好さんの疑問)を
> 提起する。bについてのt検定は、Yが正規分布する
> ことだけを前提としている:Xの値は正規分布しても
> 良いし、研究者によって選択されたものであっても
> よい。他方、rとローは、2変量正規分布からの無作為
> 標本であるとき、密接に関連づけられることを強調して
> きた。しかしながら、ロー=0という特殊の場合には、
> Yが正規分布をすると仮定できれば、Xの分布が正規型
> であってもなくても、ローの分布は同じであることを、
> Fisherは証明した。
> 
> とあります。そして、Fisherの論文として、
> 
> Fisher (1915) Biometrika,10:507
> 
> があげられています。こういうことは良く注意して
> いないと、直感的にわかりやすいX,Yが2変量正規
> 分布している方を前提に話をしてしまいがちですよね。
> もっともFisherの証明は難しくて読んでもわからない
> だろうと、最初からあきらめて読んでいません。
> 
> 
> > 「EBM実践のための統計学的Q&A」の第11章
> > 回帰と相関の最初のページに、
> > 「相関係数,rは、2連続型変数間の線形関係の
> > 強さを測るものである。、、、、この検定では、
> > 少なくとも1変数が正規分布に従わなければなら
> > ない。回帰や相関を用いた、直線関係がないという
> > 帰無仮説の検定は、数値的には等価になる。
> > 相関係数の信頼区間を計算できるが、このため
> > には両変数は正規分布に従わねばならない。」
> > とあります。(同じような記述は、 The Lady Tasting
> > Tea でも読んだ記憶があります。)
> >
> > さて、相関係数の検定では、1変数が正規分布して
> > いればよいのに、信頼区間のためには両方とも
> > 正規分布する必要があるのは、なぜなんでしょうか?
> >
> > 相関係数の検定のためには1変数が正規分布
> > していればよいというのは、回帰分析の前提条件
> > を考えればなんとなく納得がいく(たしか、「従属変数
> > が正規分布し、誤差項が正規分布すれば
> > 独立変数は正規分布していなくてもよい、」だった
> > でしょうか)のですが、相関係数の信頼区間はなぜ、
> > 同じように計算できないのでしょうか?偏回帰係数の
> > 信頼区間は計算できますよね?
> >
> > いくつかの教科書や参考書をあたってみたの
> > ですが、一般には、
> > 「はじめての統計」(有斐閣ブックス)にあるように、
> > 「実は、サイズがnの標本が2変数正規分布に
> > 従う母集団からの無作為標本である場合に限り、
> > 標本相関係数がある確率分布に従うことを導き
> > だすことができます。」(p207)とし、さらに、
> > 「相関係数がρの2変数正規分布に従う母集団から、
> > 無作為に抽出されたn組のデータの標本相関係数
> > rを、、、、、(式略)の正規分布でうまく近似できます。
> > この近似によって、母集団相関係数の信頼区間の
> > 設定や、さまざまなρの値に関する仮説検定が
> > 可能となります」(p210)というように、
> > 2変量正規分布を前提として、検定と区間推定を
> > 同時に扱っているものがほとんどのようです。
> >
> > なぜ、日本語で書かれた教科書や参考書は、この
> > ように説明するのでしょうか?
> >
> > このあたりのこと、できればわかりやすく
> > 教えていただければ幸いです。私がなにか
> > とんでもない誤解をしていなければよいと
> > 思いつつ、よろしく御願いいたします。
> 
> --
> ======================================================================
>  新潟大学教育人間科学部  柴山 直    950-2181 新潟市五十嵐2の町8050
>  E-mail:sibayama (at) ed.niigata-u.ac.jp/Tel:025-262-7249/Fax:025-262-7304
> ======================================================================
> 
> 
> 
> 


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。