[fpr 1148] 教えて下さい

岡本安晴

岡本@金沢大学です。


  "[fpr 1145] Re: 教えて下さい"より:

>どうせスカスカなのだから(周辺分布を問題にするのではなく)多変
                            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>量としてそのまま利用するのであれば,4次くらいまでのモーメント
>がそれらしければ,「平均と分散・共分散が明示的に示されていると
    ^^^^^^^^^^^^^^    ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>いう明確なメリットのある」多変量正規をイデアとして利用して構わ
  ^^^^^^^^^^^^^^^^^^                                        ^^^^
>ないのかな,などと漠然と思っていますが,皆様いかがでしょう?
  ^^^^

  周辺分布は1つの有力な情報源になりうるものです。
  「fpr 1140」の変数の単調変換に対応して因子が現れる現象の場合
のように、真の分布は何かはともかくとして、少なくとも周辺分布が
チェックされておれば、変な分析結果が出たとき尺度に問題がある
らしいというヒントが得られると思います。

  分布がそれらしいかどうかの判断を4次くらいまでのモーメントで
行うというのなら、ちょっとした計算ならパソコンで簡単にできる
時代ですから、直接、分布の検定を行うのがよいと思います。

  多変量正規に「平均と・・・明確なメリットのある」というのでは
なく、多変量解析を行うプログラムで多くの人が手軽に使える既製品は
正規分布を用いたものである、という便宜的な事情ではないでしょうか。
  便宜的といえば、真の分布が分からない、尺度の水準も順序尺度以上
というぐらいのものである、というときに(多変量)正規分布を用いた
モデルで分析を行うときには、周辺分布が正規分布になるようにデータを
変換してから分析するという方法も現在では実用的であると思います。
データがカテゴリとしてに離散化している、あるいはタイスコアがある、
というときはランク値をパーセンタイル値に直して偏差値(T得点)を
求めればよいと思います。

  正規分布を仮定しても構わないかどうかは、そのことが分析の妥当性
とどの程度関わっているかということによると思います。
  尺度水準の問題ではMeaningfulという概念があってそれによって
不変性ということが問題にされていますが、分布の問題も同様だと
思います。
  構わないかどうかは、少なくともシミュレーションなどで検討を
行ってからでないと判らないことで、それまでは便宜的に多変量
正規分布を仮定したということに過ぎないと思います。


  "[fpr 1146] Re: 教えて下さい"より:

>私が問題にしたのは「多変量正規分布が正当化できるか」
>ということではな
>く,「データに確率モデルが適用できる根拠は何か?
>また母集団分布という
>ときの母集団は何か」ということです。

  一般に、データに確率モデルが適用できるかどうかは、データが
どのような理論を背景としているかという問題だと思います。
  データの背後にある理論が確率モデルであれば統計的分析が可能
ということになります。理論が決定論的なものであれば誤差に
確率モデルを適用するというようなことがない限り確率モデルの
適用のしようがありません。

  そもそも、もとの「[fpr 1117] 教えて下さい」の場合、データは
明示されているわけですが、分析の目的などはどう理解されるべき
なのでしょうか。
  調査の対象は300人(男205名、女95名)で、回収データは
男108名、女52名となっています。回収/未回収が回答(Yes/No)
と独立とみなせない場合はそれに基づく分析となりますが、独立と
みなせる場合は、300人についての分布はどうか、あるいは
もっと一般に、その特殊な職業に従事する人一般についてはどうか
ということが問題であると思いますが、そうだとすれば、それに
合わせた確率モデルを設定して検定/推定を行わなければならなく
なります。得られたデータ(108人+52人)を超える部分に
ついて判断するのですから。

  しかし、南風原さんが指摘されたのは、確率モデル適用における
問題意識が多変量解析の場合はあまりない、ということなのですが、
それは、1変量の場合に比べて、そのような問題点の専門家による
ユーザー向けの指摘があまり行われてこなかったということによる
と思います。1変量の場合、特に分散分析の場合、いろいろな
問題点が具体的に指摘されてきました。このような具体的な指摘は、
多変量の場合、かなりの計算量が要求されるからでしょうか、
専門家によるユーザー向けの指摘は1変量に比べて見当たりません。
  今日では大抵の計算がパソコンで簡単に出来るようになりました。
今後、多変量の場合における問題点のユーザー向けの具体的な指摘が
1変量の場合と同じように行われるようになると思います。
  専門家による指摘がいろいろとなされるようになれば、ユーザー
の側からの問題提起も盛んになると思います。


                                     岡本 安晴
                                     c00279 (at) simail.ne.jp


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。