[fpr 1383] 本質的なアンバランス

南風原朝和

南風原@東大教育心理です。

Toyoda Hideki さんが以下のように書いています:
》(4)本質的にアンバランスな場合に要因が有意であることは,バランスがとれて
》いる場合と解釈が異なる.

有意かどうかというのは,セル内の分散の大きさやサンプルサイズも関わって
きて,話が難しくなってきます。アンバランスの問題は基本的には平均値差の
評価の問題だと思いますので,検定よりも推定という文脈で考えたほうが分か
りやすいと思います。

たとえば,下の表が「性」および「専攻」という要因に関して,大学生の母集
団を正確に代表する標本で得られた結果だとします。母集団を正確に代表した
結果としてアンバランスになっていますので本質的なアンバランスということ
になります。
−−−−−−−−−−−−−−−−−−
             理系         文系
−−−−−−−−−−−−−−−−−−         
  男子  全体の40%  全体の10%
         平均10点    平均5点
−−−−−−−−−−−−−−−−−−
  女子  全体の10%  全体の40%
         平均10点    平均5点
−−−−−−−−−−−−−−−−−−

この表から,理系全体の平均は10点,文系全体の平均は5点で,5点の差が
あることは明らかです。問題は男女の比較ですが,男子全体の平均は(平均の
高い理系が多いために)9点,女子全体の平均は(平均の低い文系が多いため
に)6点となり,男子が3点高くなります(分析1)。

これをバランスをとるために,理系の男子と文系の女子のデータのそれぞれ4
分の1ずつを除去したとします。このときセル平均には変化がなかったとする
と,男女の平均はいずれも7.5点となって差がないことになります(分析2)。

一方,専攻別に男女を比較すると,つまり,単純主効果に注目すると,いずれ
の専攻でも男女の平均は等しく,ここでも差がないことになります(分析3)。

分析2は,母集団の構成に対して敢えて偏った構成の標本を作ったために,母
集団における平均値差の推定を誤ったケースと言えます。しかし,仮に分析3
のような分析に関心があるとしたら,この場合は,分析2が妥当な結果を与え
たことになります。分析1の結果をとるか分析2,3の結果をとるかは,分析
の目的次第でしょう。なお,上のデータに対してタイプIIの平方和を用いると,
「専攻」の要因の影響を除いた場合の,「性」の要因の平方和が算出されます
が,その値はゼロとなり,分析2の結果と一致します(分析4)。

交互作用については,総平均が7.5点ですから,教科書の公式に従えば,た
とえば左上のセルについては (10-9-10+7.5)^2 にサンプルサイズを掛け,他
のセルについても同様の量を計算して合計すると平方和が求まります。このデ
ータの場合,その値は正となり,少なくとも標本レベルでは交互作用があるこ
とになります(分析5)。

一方,よくなされるようにセル平均をプロットすると,セル平均を結ぶ2本の
線分は完全に平行になり,標本レベルでも交互作用は全くないという印象を与
えます(分析6)。

ここでも分析2のようにしてバランスをとると,セル平均に変化がなかった場
合,計算上も交互作用はゼロとなり分析6と整合的な結果となります(分析7)。

交互作用を,「セル平均の差の差」と定義すれば上の表のデータの場合は,交
互作用がゼロというのが妥当な結果となり,分析5の結果はアンバランスのた
めに生じた幻の交互作用ということになります。ただし,上のデータのままで
も,「性」と「専攻」の要因の影響を先に除いた平方和を求めれば,その値は
ゼロとなって「交互作用なし」という結果になります(分析8)。

Toyoda Hideki さんが以下のように書いています:
》アンバランスな要因が多くなるといずれにせよ解釈が困難になるのではないか.

その通りだと思います。交互作用が入ってくる分,重回帰分析や斜交因子分析
の解釈以上に難しいと言えるでしょう。

---
南風原朝和 haebara (at) educhan.p.u-tokyo.ac.jp 
〒113-0033 東京大学 大学院教育学研究科
TEL:03-5802-3350 FAX:03-3813-8807

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。