狩野@大阪大学です 優秀な学生から発せられるFAQではないでしょうか. 偏回帰係数=0や母相関係数=0の検定統計量の分布の 導出では,xを与えた下でのyの条件付分布を考えます. その条件の下で,検定統計量の分布がt-分布になることを 導きます.t-分布は与えたxの値に依存しないことから,条件を 外しても同じ分布と考えてよいという結論が得られます. つまり,「xを与えた下でのyの条件付分布」が重要で,xの分布 自体は何でもよいということなのです. 多変量解析ではスタンダードな理論展開で,理論的な教科書には 必ず出ています. この結果があるから,回帰分析の一般論は,xを固定変数として 理論展開できるのです.xとyが身長,体重という場合に,身長は 固定変数,体重は正規分布としてよい理由がここにあります. SEMでも,性別などの属性変数は,独立変数として用いるのならば 「罪は重くない」ということなのですが,その理論的根拠も同じところ にあります. なお,信頼区間では母相関係数はゼロとは限りませんから, 上記の議論は使えません.検定の場合は帰無仮説のもとでの 分布を考えますから母相関係数はゼロとなります. ○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○ 狩野 裕 大阪大学人間科学部 〒565-0871 吹田市山田丘1−2 Phone/Fax:06-6879-8052 http://koko15.hus.osaka-u.ac.jp/~kano/ You can get pdf files of the current articles of Behaviormetrika. Visit http://wwwsoc.nii.ac.jp/bsj/behaviormetrika_index.html ●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○● > 三好さん > > こんにちは、新潟大学の柴山です。 > > お手元にスネデカー・コクラン「統計的方法 原初第6版」 > 畑村・奥野・津村共訳 岩波書店があれば、p176-7を > ご覧下さい。そこに、(以下引用です) > > この関係は、不可思議な問題点(=三好さんの疑問)を > 提起する。bについてのt検定は、Yが正規分布する > ことだけを前提としている:Xの値は正規分布しても > 良いし、研究者によって選択されたものであっても > よい。他方、rとローは、2変量正規分布からの無作為 > 標本であるとき、密接に関連づけられることを強調して > きた。しかしながら、ロー=0という特殊の場合には、 > Yが正規分布をすると仮定できれば、Xの分布が正規型 > であってもなくても、ローの分布は同じであることを、 > Fisherは証明した。 > > とあります。そして、Fisherの論文として、 > > Fisher (1915) Biometrika,10:507 > > があげられています。こういうことは良く注意して > いないと、直感的にわかりやすいX,Yが2変量正規 > 分布している方を前提に話をしてしまいがちですよね。 > もっともFisherの証明は難しくて読んでもわからない > だろうと、最初からあきらめて読んでいません。 > > > > 「EBM実践のための統計学的Q&A」の第11章 > > 回帰と相関の最初のページに、 > > 「相関係数,rは、2連続型変数間の線形関係の > > 強さを測るものである。、、、、この検定では、 > > 少なくとも1変数が正規分布に従わなければなら > > ない。回帰や相関を用いた、直線関係がないという > > 帰無仮説の検定は、数値的には等価になる。 > > 相関係数の信頼区間を計算できるが、このため > > には両変数は正規分布に従わねばならない。」 > > とあります。(同じような記述は、 The Lady Tasting > > Tea でも読んだ記憶があります。) > > > > さて、相関係数の検定では、1変数が正規分布して > > いればよいのに、信頼区間のためには両方とも > > 正規分布する必要があるのは、なぜなんでしょうか? > > > > 相関係数の検定のためには1変数が正規分布 > > していればよいというのは、回帰分析の前提条件 > > を考えればなんとなく納得がいく(たしか、「従属変数 > > が正規分布し、誤差項が正規分布すれば > > 独立変数は正規分布していなくてもよい、」だった > > でしょうか)のですが、相関係数の信頼区間はなぜ、 > > 同じように計算できないのでしょうか?偏回帰係数の > > 信頼区間は計算できますよね? > > > > いくつかの教科書や参考書をあたってみたの > > ですが、一般には、 > > 「はじめての統計」(有斐閣ブックス)にあるように、 > > 「実は、サイズがnの標本が2変数正規分布に > > 従う母集団からの無作為標本である場合に限り、 > > 標本相関係数がある確率分布に従うことを導き > > だすことができます。」(p207)とし、さらに、 > > 「相関係数がρの2変数正規分布に従う母集団から、 > > 無作為に抽出されたn組のデータの標本相関係数 > > rを、、、、、(式略)の正規分布でうまく近似できます。 > > この近似によって、母集団相関係数の信頼区間の > > 設定や、さまざまなρの値に関する仮説検定が > > 可能となります」(p210)というように、 > > 2変量正規分布を前提として、検定と区間推定を > > 同時に扱っているものがほとんどのようです。 > > > > なぜ、日本語で書かれた教科書や参考書は、この > > ように説明するのでしょうか? > > > > このあたりのこと、できればわかりやすく > > 教えていただければ幸いです。私がなにか > > とんでもない誤解をしていなければよいと > > 思いつつ、よろしく御願いいたします。 > > -- > ====================================================================== > 新潟大学教育人間科学部 柴山 直 950-2181 新潟市五十嵐2の町8050 > E-mail:sibayama (at) ed.niigata-u.ac.jp/Tel:025-262-7249/Fax:025-262-7304 > ====================================================================== > > > >
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。