狩野@つくば大学です > 堀 啓造@香川大学経済学部です。[fpr 371]の自己フォローです。 > > >(4)SASとEQSがAIC=χ2−2df を使っているのは問題がありそう。AICだ > >から2tを使うのが筋のように思えるが、dfを使う意味がなにかあるのでしょうか。 > > Bollen and Long (eds.) Testing structural equation models. Sage. 1993 > > を眺めていると、Bollen, Joreskogの2人は別の章を書いていますが、 > AIC=χ2−2df を使ってます。宗旨替えか。こちらのほうがメリットがあるのかな > 。Bollen の章のグラフを見ていると、マイナスに意味がありそうがグラフがでています > 。やはり知りたい、どういう意味があるのか。 別に意味がある訳ではありません。どちらでも良いのです。 項目数: p パラメータ数: t=dim(θ) 自由度: df とすると、 df=p(p+1)/2-t なる関係式があるので χ^2 - 2df = χ^2 + 2t-p(p+1) となり、-2df を使っても +2t を使っても、定数 -p(p+1) しか違わないことに なります。AIC はそれ自身の値には意味はなく、2つ以上のモデル間の比較(AIC の差)に意味があるので、定数を加えたり、引いたりしても問題はないのです。 ここで、「定数」とは、モデルΣ(θ)に依存しない量で、確率変数であってもか まいません。 CSA の context では、χ^2 とその自由度 df がなじみが深いので、パラメータ数 を表に出していないソフトが多いのだと思います。 以下補足: AIC の本来の定義は AIC = -2(モデルの最大対数尤度)+2(モデルの自由パラメータ数) です。正規母集団では、共分散構造モデルΣ(θ)に対して -2(モデルの最大対数尤度)=n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}]+ plog(2π)} ですが、これ自身はχ2 ではありません。「定数」である n{plog(2π)+log|S|+p} をひくことにより、 n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}] - log|S| - p} が、χ2 のパートになるのです。ここで既に、「定数を加えたり、引いたりしても 問題はない」という性質を使っています。 CSA でよくでてくる AIC の定義は AIC=χ2 - 2df =n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}] - log|S| - p} - 2df ですが、本来のAICの定義との違いをみるために、若干の式変形をすると =n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}] + plog(2π) -plog(2π) - log|S| - p} - 2(p(p+1)/2-t) =n{log|Σ(^θ)| + tr[SΣ(^θ)^{-1}] + plog(2π)} + 2t -nplog(2π) - nlog|S| -np - p(p+1) =AIC - nplog(2π)- nlog|S| - np - p(p+1) となります。したがって、CSA のパッケージでのAICの出力の多くは - nplog(2π)- nlog|S| - np - p(p+1) が、本来のAICの定義に加えられている、ということになります。 ==================================================================== 狩野 裕 (筑波大学数学系) Phone&Fax: 0298-53-4229(DI) address: 〒305 つくば市天王台1-1-1 Fax: 0298-53-6501(Department) e-mail: kano (at) math.tsukuba.ac.jp ====================================================================
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。