林由芽子@鉄道総研です。 まず、皆様の反応に感謝致します。 さて、以前だしました問題は、 分散分析と被験者数の問題です。私が以前出したマトリックスは > >> fpr65> 被験者 | 若年群 | 高年群 | 合計 > >> fpr65> -------------------------------- > >> fpr65> 一般群 | 20 | 99 | 119 > >> fpr65> -------------------------------- > >> fpr65> 特殊群 | 83 | 70 | 153 > >> fpr65> -------------------------------- > >> fpr65> 合計 | 103 | 169 | 272 (人) です。私の言葉が少なかったようですが、 この場合、 、芳賀@鉄道総研が説明するように、[特殊群]というのは事故経験群であって、 一般群と比べて、かなり、人数が少ないというのが、現実です。 つまり、我々が提示したこのマトリックスは、人数比が現実にたいしてパラドックス になっているのです。 データを抽出する際の無作為抽出には問題がなく、母集団での人数比を反映している ならまだしも、同数ならまだしも、この場合でも、比較という土俵に のせていいのだろうか、というのが今回の疑問です。 本当にランダムであったのかが、疑わしく思えます。 この問題に対しては、我々の方でも討議致しました。結論的には、 南風原氏のおっしゃる通り、 [人数不揃いのデータでも、分布の比較が必ずしも{ナンセンス}ではない] だと思われます。 つまり、被験者数の問題があろうと、分散分析の前提となる諸仮説(例:等分散性)が 支持されていれば、問題はないと思います。けれど、実際には 分散分析の際、いちいち仮説の検定からやっている研究は少ないと思います。 では、どの程度、被験者数の不揃いがあったとき注意が必要なのでしょうか??? 分布を確認しない分析が多いのは確かですが、 どの程度なら怪しいと感じるのでしょうか? 現実に、被験者数が異なるデータはたくさんあることでしょう。 実際の手続き上、少ない被験者群に他のセルの被験者数を合わせるのは、 情報が失われる点で(もったいないので)、するべきではないと思います。 ここで考えられるのは二つ 1。二群から同数とる。つまり、各群についてランダム (現実の人数比を反映していないが、分析の前提条件としては 問題ないと仮定できる) 2。ランダム抽出してから、二群にわける。 (当然、データ数は母集団に対応して不揃い) です。 私自身、比較という概念からすれば、比較する要因以外の部分については 同条件にするのが望ましいのではないかと思います。でも、完全なランダムというと 2の方法の方が良いような気もします。もちろん、2の方法でやって、 今回のように、パラドックスな被験者比になることもあるでしょうし、 その場合にも、検定は可能でしょう。 でも、もう一プロセス、前提条件である仮説の検定を考えることも 必要なのではないのでしょうか? 数字的には問題のない部分であっても、直観的に [なにかおかしい] と、感じた時、それをつきつめるのも研究として面白いと思います。 ================================================================= (財)鉄道総合技術研究所 基礎研究部 安全心理研究室 tel (0425)-73-7346 mail yumeko (at) rtri.or.jp 林 由芽子 ================================================================
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。