[fpr 1387] About ANOVA(SS)

前川眞一


また私にふられましたので簡単にコメントいたします。

Junji Kishimoto wrote:
> 
> 岸本@SASです。
> 
> ところで、この Type II と Type III の平方和の違いというのが実に
> 微妙な問題で、昔から統計学者の議論の種になっていました。今でも
> 決着はついていません。で、SAS は2つの主張に Type II, Type III と
> いう名前をつけて明確にし、どちらを使うかは解析者の責任ということ
> にしました。
> 
これはおっしゃるとおりです。決着はついていないと思います。

> ここで議論になっている状況は、「交互作用が存在するときの主効果
> の検定」です。交互作用が存在するときには主効果の検定には意味が
> ないと考えるのも一つの態度ですが、少々の交互作用を越えて意味の
> ある主効果の大きさを推定したいという要求も考えられるところです。
> 
これもおっしゃるとおりです。
ただ、交互作用がないときに関しても、誤差項をプールするか否かという
問題が残っています。ゼロと見なせる交互作用のパラメタは捨てていいとする
意見と、モデルを途中で変更することに対する抵抗とがあり、この問題も
決着していないと思います。


> ところで、交互作用を含む計画行列の作り方には恣意性があります。

これ以下の議論に関しては、とりあえず以下のことをコメントします。

色々な交互作用の定義に関しては、それがセル平均とどのような関連が
あるかを知っておくことが大切です。岸本さんが示された3つのデザイン
行列のどれを使っても、全ての2乗和は同じものになりますが、
ここのパラメタの意味(セル平均との関係)が変わってきます。

これは、回帰分析型のモデルを
 y = X b + e
ただし、X は、
例えば、

 >         m A B AB
 > A1 B1   1 1 1 1
 > A1 B2   1 1 0 0
 > A2 B1   1 0 1 0
 > A2 B2   1 0 0 0
  b = {m A B AB} 
とし、
セル平均モデルを
  y = Z a + e
ただし、
  Z = 4 x 4 の単位行列, 
  m = {mu11, mu12, mu21, mu22}
としたときに、ふたつのモデルの期待値を等しいと置いた
  X b = Z a
を b に関して解くことにより
  b = C Z a
ただし   C = \inv{X`X}X`
を調べることにより解ります。
この場合、
  C = {
    0         0         0         1
    0         1         0        -1
    0         0         1        -1
    1        -1        -1         1
    }
となりますから、
  m = mu22
  A = mu12 - mu22
  B = mu21 - mu22
  AB = mu11 - mu12 - mu21 + mu22
です。

X として
 >        A  B  X
 > A1 B1  1  1  1
 > A1 B2  1 -1 -1
 > A2 B1 -1  1 -1
 > A2 B2 -1 -1  1
を使うと
  C = {
    0.25      0.25      0.25      0.25
    0.25      0.25     -0.25     -0.25
    0.25     -0.25      0.25     -0.25
    0.25     -0.25     -0.25      0.25
    }
ですから、
  m = 全セルの平均
  A = 1/2( (mu11+mu12)/2 - (mu21+mu22)/2 )
  B = 1/2( (mu11+mu21)/2 - (mu12+mu22)/2 )
 AB = 1/4( mu11 - mu12 - mu21 + mu22 )
となります。

検定結果は変わらないのですが、パラメタの意味が大きく変わることになりま
す。
通常はこの各主効果パラメタの和がゼロというパラメトライゼーションを
用いると思います。


> 
> 要は「Type II の平方和では、セルサイズによる重みが影響して
> くるのに対し、Type III の平方和ではセルサイズによる重みを
> つけない効果を推定してそれを捨象している」というのが2つの
> 平方和の違いなのです。
> 
これは仰せの通りです。また、ここも決着していません。
検定するべき仮説はデータを取る前から解っているはずだから
そこに n が入るのはおかしいという議論が正論ではないかとも
思いますが。

いずれにしても、アンバランスな分散分析ではどのような仮説が検定されて
いるのか、ということがあまり知られていないようです。
回帰分析型のモデルにしても、セル平均型のモデルにしても、
type I や type II の2乗和を用る仮説検定では、びっくりするような
仮説が検定されています。この点に関してはまたそのうちに
ご報告いたします。

-- 
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
Shin-ichi Mayekawa                                      前川眞一
Research Division                                       大学入試センター
The National Center for University Entrance Examinations  研究開発部
phone: +81-3-3468-3311, +81-3-5478-1284, 85    fax:  +81-3-5478-1297
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。