南風原@東大教育心理です。 豊田さん@立教大学が以下のように書いています: > "Haebara, T." <haebara (at) educhan.p.u-tokyo.ac.jp> さんは書きました: > >南風原@東大教育心理です。 > >あと,可能なのは,そうした架空の(しかし具体的な)母集団を作り出すのでは > >なく,得られた結果の解釈に,そのデータとは別世界の確率モデルの中で成り立 > >つ事実を参考資料として利用するということです。ご質問の例なら,「比率の等 > >しい2つのベルヌイ分布から,n1=108,n2=52の無作為標本をとるとき,標本 > >比率の差(特定の指標で測った差)が今回のデータで得られた差を超える確率p > >は,通常の有意水準よりかなり大きい」というのは事実として言えるわけです。 > >このことが結果を解釈する上で何らかの意味があると判断されるなら利用すれば > >よいということになります。これも,上の議論とは違う意味で hypothetical > >population に基づく議論とは言えますが。 > > 手元に正確な情報がないので,巻数,ページは示せないのですが, > 教育心理学年報における貴論文を読み,おりにふれて利用しよう > と心がけてきました.しかし通常,当該調査の状態が数学的な事 > 実からどれほど乖離しているかの明確な指針がないことがほとん > どで,現実には上記のような数学的事実をなかなか調査結果の解 > 釈に役立てられませんでした. 上記の議論は,データ収集の手続きからして,確率論を適用する正当な根拠が ない場合,それでも検定等をするとしたら,どんな意味が考えられるか,とい う観点からの議論です。ですから「当該調査の状態が数学的な事実からどれほ ど乖離しているか」の査定はもともと無理な状況での,つまり現実とモデルと の突き合わせという問題とは異なる水準での話です。たとえば,ある政策につ いての支持率が3/4で過半数であったとします。このとき,これが「4人中 3人が支持」という結果だとしたら,「表裏の確率が半々のコインでも4回中 3回表というのは珍しくない。したがって過半数と言っても4人に3人ぐらい じゃ,特に何と言うこともない。」というような解釈の仕方です。4人の回答 者がどういう母集団に属するかとか,どういう手続きで選ばれたかということ は不問のままでも,4の3という結果の解釈にこのような確率的な考えを導入 することはできるのではないかということです。 こういうふうに確率を解釈しましょうという提案ではなく,また,フォーマル に研究論文等に書けるような解釈でもありませんが,無作為抽出のような手続 き的根拠がない場合に,確率的議論にまったく何の意味もないかというと,上 記のように考えればまったく無意味とも言えないのではないかという話です。 逆に言えば,データが確率的に得られていない場合のp値などは,たかだかそ の程度の意味しかもっていないのではないか,ということでもあります。 豊田さんの続きです: > "Haebara, T." <haebara (at) educhan.p.u-tokyo.ac.jp> さんは書きました: > >ところで,差の検定のような基本的な検定の場合は,母集団と標本の関係に頭を > >悩ますのに,多変量解析のような複雑な分析になると「母集団分布に多変量正規 > >分布を仮定」といったことが問題になりにくいのは何故でしょうね。 > >2変数の場合に,平均を0に調節すると,中学で習った座標軸がかけて >4つの象限ができます.データが3つしかないとデータの無い象限が >生じます.そんなスカスカな状況では背後に仮定する分布は何でも構 >いません.3変数の場合は8つ,4変数の場合は16の象限があります. >標本数が5こや6こではスカスカで分布形は問えません.20変数の >場合は象限の数は,,,2の20乗,なんと軽く1000000を越えます. >したがって標本数を数千とってもスカスカです.ほとんどの象限にデ >ータはありません. > >どうせスカスカなのだから(周辺分布を問題にするのではなく)多変 >量としてそのまま利用するのであれば,4次くらいまでのモーメント >がそれらしければ,「平均と分散・共分散が明示的に示されていると >いう明確なメリットのある」多変量正規をイデアとして利用して構わ >ないのかな,などと漠然と思っていますが,皆様いかがでしょう? 私が問題にしたのは「多変量正規分布が正当化できるか」ということではな く,「データに確率モデルが適用できる根拠は何か? また母集団分布という ときの母集団は何か」ということです。そういう問題が,多変量解析のよう な高度な分析になってくると問題としてあまり問われなくなってくるのでは ないかという感想です。仮にデータの分布がたとえば正規分布に似ていても, このことは,その後者の問題に対する答えにはならないですよね。 --- 南風原朝和 haebara (at) educhan.p.u-tokyo.ac.jp 〒113-0033 東京大学 大学院教育学研究科 TEL:03-5802-3350 FAX:03-3813-8807
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。