[fpr 1384] About ANOVA(SS)

岸本淳司

岸本@SASです。

SAS の Type I 〜 Type IV までの4つの平方和は非常にわかりにくく、
SAS のマニュアルや「SASによる実験データの解析」を読んでも今ひとつ
ピンとこないものです。そういう本では計算の手続きは紹介してありま
すが、根本的な動機が説明されてないからだと思います。というわけで、
私が説明を試みましょう。

Type I の平方和は、前川先生の説明にあるように効果を順番に加えて
いきます。ですから、共分散分析とか多項式の検定のように、効果に
階層があるときに使います。普通の要因実験では使いません。

Type II, III, IV の平方和は検討したい要因だけを Partial にとり
出して検定する方法で、アンバランスデータの要因実験の解析に普通に
使う方法で、よく似ています(バランスデータならすべて一致する)。
この中で、Type IV の平方和は役に立たないので忘れていいでしょう。
とすると、問題は、Type II の平方和と Type III の平方和との使い
方の違いということになります。

ところで、この Type II と Type III の平方和の違いというのが実に
微妙な問題で、昔から統計学者の議論の種になっていました。今でも
決着はついていません。で、SAS は2つの主張に Type II, Type III と
いう名前をつけて明確にし、どちらを使うかは解析者の責任ということ
にしました。

ここで議論になっている状況は、「交互作用が存在するときの主効果
の検定」です。交互作用が存在するときには主効果の検定には意味が
ないと考えるのも一つの態度ですが、少々の交互作用を越えて意味の
ある主効果の大きさを推定したいという要求も考えられるところです。

ところで、交互作用を含む計画行列の作り方には恣意性があります。
たとえば、次のようなデータがあって、

 Y
6│    ○
 │   /
 │  /
 │ /
2│○
1│●───●
 └┬───┬
 A1   A2
○:B1 ●:B2

このようなデータに対し、

      A B X
A1 B1 1 1 1
A1 B2 1 0 0
A2 B1 0 1 0
A2 B2 0 0 0

という計画行列(A:主効果、B:主効果、X:交互作用)で解析したと
すると、交互作用の効果は(A1,B1)のセルにだけ効いてきますから、
交互作用について調整した残りのセル平均は次のようになって:

 Y
6│○───○
 │↑
 │↑
 │↑
2│☆
1│●───●
 └┬───┬
 A1   A2
○:B1 ●:B2

交互作用の効果は4、要因Aの主効果は0、要因Bの主効果は5と
いうことになります。

一方、次のような計画行列に変更すると、

      A B X
A1 B1 1 1 0
A1 B2 1 0 0
A2 B1 0 1 1
A2 B2 0 0 0

今度は、交互作用を調整は(A2,B1)のセルに効いてきますから、調整後
のセル平均は次のようになって:

 Y
6│    ☆
 │    ↓
 │    ↓
 │    ↓
2│○───○
1│●───●
 └┬───┬
 A1   A2
○:B1 ●:B2

交互作用の大きさは同じく4で、要因Aの主効果も同じく0ですが、
要因Bの主効果は今度は1と推定されることになります。

その他の場合も含めて、交互作用項を表す計画行列の列を変更する
だけで、各主効果の推定値が変わってくる様子がわかると思います。
これは妙なことです。元の図を見ると要因Aも要因Bもそれなりに
主効果はありそうに思えます。結論として、(考慮なしに)交互作用
項をモデルに含ませると、主効果の検定が無意味になってしまうの
です。

Type II の平方和とは、つまり「主効果を考えるときには交互作用
は考えない」という発想です。ですから、要因Aの主効果は
(2+1)/2 - (6+1)/2 = -2
であり、要因Bの主効果は
(2+6)/2 - (1+1)/2 = 3
と計算されます。

このように計算された主効果は、発想に不自然なところがなく、
全然問題ないように思えます。ところが、ここに大きな落とし穴
がありました。今議論しているデータはもともとセルサイズが
不均一だったのです。ですから、上で計算したような単純な平均
を計算するのは間違いで、「セルサイズで重みをつけた平均」を
計算しなければいけないのです。

効果の大きさを測るときに、反復測定した回数に影響されるのは
不自然だという考え方もあります。そこで、交互作用の「大きさ」
をバランスよく推定し、セルサイズの違いに影響を受けないよう
に各主効果の大きさを計算しようという方法になります。これが
Type III の平方和です。

 Y
6│    ☆
 │    ○
 │
 │○
2│☆   ●
1│★   ★
 └●───┬
 A1   A2
○:B1 ●:B2

       A  B  X
A1 B1  1  1  1
A1 B2  1 -1 -1
A2 B1 -1  1 -1
A2 B2 -1 -1  1

要は「Type II の平方和では、セルサイズによる重みが影響して
くるのに対し、Type III の平方和ではセルサイズによる重みを
つけない効果を推定してそれを捨象している」というのが2つの
平方和の違いなのです。セルサイズによる重みを与えた方がいい
のか、無視した方がいいのか、議論は決着していません。私は
無視した(つまり Type III の)方がいいと思っているのですが、
Type II派の人は「セルサイズが極端に違う場合、たとえばある
セルのサイズがゼロであっても等しい重みをかけるというのか。
そんな方法に統計的妥当性は認めない!」と主張しています。

(前川先生へ)
いつもお世話になっています。かなり前にお会いしてお話した
ときは上のような整理された議論にはなっていませんでした。
こんなものでどうでしょうか?
私は行動計量学会第20回大会の発表論文抄録集をもっていま
せん。なにかあったら指摘して下さい。

ξ
■ゞ(^_^) Kishimoto   SAS Institute Japan  The opinions expressed here
jpnjak (at) jpn.sas.com    1-13-1 Kachidoki     are mine and not necessarily
(03) 3533-3831        Chuo-ku Tokyo 104    those of SAS Institute.


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。