[fpr 81] sample number

林由芽子

   
林由芽子@鉄道総研です。

                       まず、皆様の反応に感謝致します。

さて、以前だしました問題は、
分散分析と被験者数の問題です。私が以前出したマトリックスは

     >   >>  fpr65>    被験者 |  若年群 | 高年群 | 合計
     >   >>  fpr65>    --------------------------------
     >   >>  fpr65>    一般群 |    20   |   99   | 119
     >   >>  fpr65>    --------------------------------
     >   >>  fpr65>    特殊群 |    83   |   70   | 153
     >   >>  fpr65>    --------------------------------
     >   >>  fpr65>    合計   |   103   |  169   | 272 (人)

です。私の言葉が少なかったようですが、 この場合、 
、芳賀@鉄道総研が説明するように、[特殊群]というのは事故経験群であって、
一般群と比べて、かなり、人数が少ないというのが、現実です。

つまり、我々が提示したこのマトリックスは、人数比が現実にたいしてパラドックス
になっているのです。
  データを抽出する際の無作為抽出には問題がなく、母集団での人数比を反映している
ならまだしも、同数ならまだしも、この場合でも、比較という土俵に
のせていいのだろうか、というのが今回の疑問です。
本当にランダムであったのかが、疑わしく思えます。

  この問題に対しては、我々の方でも討議致しました。結論的には、
南風原氏のおっしゃる通り、
[人数不揃いのデータでも、分布の比較が必ずしも{ナンセンス}ではない]
だと思われます。

 つまり、被験者数の問題があろうと、分散分析の前提となる諸仮説(例:等分散性)が
支持されていれば、問題はないと思います。けれど、実際には
分散分析の際、いちいち仮説の検定からやっている研究は少ないと思います。
では、どの程度、被験者数の不揃いがあったとき注意が必要なのでしょうか???
分布を確認しない分析が多いのは確かですが、
どの程度なら怪しいと感じるのでしょうか?

現実に、被験者数が異なるデータはたくさんあることでしょう。

実際の手続き上、少ない被験者群に他のセルの被験者数を合わせるのは、
情報が失われる点で(もったいないので)、するべきではないと思います。

ここで考えられるのは二つ

 1。二群から同数とる。つまり、各群についてランダム
(現実の人数比を反映していないが、分析の前提条件としては
問題ないと仮定できる)

 2。ランダム抽出してから、二群にわける。
     (当然、データ数は母集団に対応して不揃い)
です。

私自身、比較という概念からすれば、比較する要因以外の部分については
同条件にするのが望ましいのではないかと思います。でも、完全なランダムというと
2の方法の方が良いような気もします。もちろん、2の方法でやって、
今回のように、パラドックスな被験者比になることもあるでしょうし、
その場合にも、検定は可能でしょう。
でも、もう一プロセス、前提条件である仮説の検定を考えることも
必要なのではないのでしょうか?
      
数字的には問題のない部分であっても、直観的に
[なにかおかしい]
と、感じた時、それをつきつめるのも研究として面白いと思います。

=================================================================
 (財)鉄道総合技術研究所 基礎研究部 安全心理研究室
  tel (0425)-73-7346
  mail  yumeko (at) rtri.or.jp                 林 由芽子
================================================================
  
  
 
	














スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。