こんにちは。 実は知り合いからデータの分析法に ついて助言を求められ、以下のように答えようかと 考えています。ただその前にみなさんのコメントを いただけたらと思い、書いています。 「問題」(少し変えてあります) 「年代によって、好きな動物が異なる」という仮説を 確かめるために: 「あなたは犬と猫とどちらが好きですか」という質問を 10代22人、20代35人、30代32人、計89人にした。 そして「1.犬」「2.猫」「3.どちらでもない」の3件法で 答えてもらった。 その結果 犬 猫 どちらでもない 合計 10代 17 1 4 22 20代 18 3 14 35 30代 23 2 7 32 ーーーーーーーーーーーーーーーーーーーー 計 58 6 25 89 という結果を得た。 「分析上の問題」 1.ふつうなら、χ2乗検定を使って 「年代間で回答パターンが異なる」ということを 示すのが第1ステップなのだろう。しかし、このデータでは 猫と回答する人の数が少ない。そのため、 通常χ2乗検定をするときに適用される 「期待度数が5未満のセルは25%以下」という条件に 抵触してしまう。つまり、単純にχ2乗検定を当てはめる わけにはいかない。 2.知り合いの持っている統計パッケージの性能のため、 exact test をすることができない。 そこで、私に求められたのは、この2つの問題を避けて、 仮説を統計的に検討する方法を提案することでした。 「私が提案してみようかと思う回答」 1.まず、各世代別の回答者数(22人、35人、32人) に対して「どちらでもない」 と答えた人の人数の比率を、3組の対比較(ロジット変換 し、z値を計算して2つの比率を検定する)で検討する。 このとき、テューキーの方法による多重比較を用いる。 つまり、誤差分散を計算するときに3つの年代を込みにして 計算する。そして、得られたz値が、 |z|≧q(a,Φ,α)/sqrt(2) のとき比較している2つの年代 には比率の差があると考える。ただし、q(a,Φ,α)はステューデント 化された範囲の100α%の地点とする。こうして、まず、 「どちらでもない」と答えた人が年代によって異なるかどうか検討する。 2.次に、同じことを、各世代で「1.犬」と答えた人、「2.猫」と答えた人 に関しても行う。 このように仮説の検討を3つのステップに分けることで、研究仮説を 検討するのはどうか、と考えています。 さて、私が助言を求めたいのは、 1.私の回答の方法は許されるかということ、 (3つに分けて考えるという分析の仕方、各グループの人数の 大きさ等の問題がまず、気になります。) 2.(1と関連して)、この分析法ではどんなことが問題であるか、 3.別の方法はないかということ の3点です。 助けていただけると幸いです。 敬具 --------------------------- Hiroto Miyoshi (三好弘人) h_m_ (at) po.harenet.ne.jp
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。