狩野@つくば大学です
> 堀 啓造@香川大学経済学部です。[fpr 371]の自己フォローです。
> 
> >(4)SASとEQSがAIC=χ2−2df を使っているのは問題がありそう。AICだ
> >から2tを使うのが筋のように思えるが、dfを使う意味がなにかあるのでしょうか。
> 
> Bollen and Long (eds.) Testing structural equation models. Sage. 1993
> 
> を眺めていると、Bollen, Joreskogの2人は別の章を書いていますが、
> AIC=χ2−2df を使ってます。宗旨替えか。こちらのほうがメリットがあるのかな
> 。Bollen の章のグラフを見ていると、マイナスに意味がありそうがグラフがでています
> 。やはり知りたい、どういう意味があるのか。
別に意味がある訳ではありません。どちらでも良いのです。
項目数: p
パラメータ数: t=dim(θ)
自由度: df
とすると、
     df=p(p+1)/2-t
なる関係式があるので
χ^2 - 2df = χ^2 + 2t-p(p+1)
となり、-2df を使っても +2t を使っても、定数 -p(p+1) しか違わないことに
なります。AIC はそれ自身の値には意味はなく、2つ以上のモデル間の比較(AIC
の差)に意味があるので、定数を加えたり、引いたりしても問題はないのです。
ここで、「定数」とは、モデルΣ(θ)に依存しない量で、確率変数であってもか
まいません。
CSA の context では、χ^2 とその自由度 df がなじみが深いので、パラメータ数
を表に出していないソフトが多いのだと思います。
以下補足:
AIC の本来の定義は
AIC = -2(モデルの最大対数尤度)+2(モデルの自由パラメータ数)
です。正規母集団では、共分散構造モデルΣ(θ)に対して
-2(モデルの最大対数尤度)=n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}]+ plog(2π)}
ですが、これ自身はχ2 ではありません。「定数」である
n{plog(2π)+log|S|+p}
をひくことにより、
n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}] - log|S| - p}
が、χ2 のパートになるのです。ここで既に、「定数を加えたり、引いたりしても
問題はない」という性質を使っています。
CSA でよくでてくる AIC の定義は
AIC=χ2 - 2df
   =n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}] - log|S| - p} - 2df
ですが、本来のAICの定義との違いをみるために、若干の式変形をすると
   =n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}] + plog(2π) -plog(2π)
     - log|S| - p} - 2(p(p+1)/2-t)
   =n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}] + plog(2π)} + 2t 
     -nplog(2π) - nlog|S| -np - p(p+1)
   =AIC - nplog(2π)- nlog|S| - np - p(p+1)
となります。したがって、CSA のパッケージでのAICの出力の多くは
     - nplog(2π)- nlog|S| - np - p(p+1)
が、本来のAICの定義に加えられている、ということになります。
====================================================================
狩野  裕 (筑波大学数学系)      Phone&Fax: 0298-53-4229(DI)
address: 〒305 つくば市天王台1-1-1    Fax: 0298-53-6501(Department)
 e-mail: kano (at) math.tsukuba.ac.jp     
====================================================================
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。