岡本@金沢大学です。 "[fpr 1464] AIC の1,2程度の差"でAICが話題になりましたので、 AICの分布についてシミュレーションで調べてみました。 AICは、その導出においては、データ数が十分多いという仮定と 幾つかの近似式・漸近式が用いられています(鈴木義一郎「情報量 基準による統計解析入門」,1995;坂元慶行「カテゴリカルデータの モデル分析」、1985;坂元・石黒・北川「情報量統計学」、1983)が、 その形は AIC = -2*(最大対数尤度) + 2*(自由パラメータ数) という簡単な式で与えられるものです。 上式をみると、モデルを固定したとき、最大対数尤度はデータの 関数なので確率変数です。すなわち、AICの値は、モデルを固定した ときはt値やF値のような確率変数となっています。このAICという 確率変数の相対的な大小関係に基づいて最適モデルの選択を行うと いうことです。確率変数に基づく決定ですからエラーもあります。 AICの分布とエラーについて、シミュレーションで調べてみました。 データはN個のデータを2つ、{Xi};i=1,...,N と {Yj};j=1,...,N、 独立にとります。いずれも、平均0、分散1の正規分布従う乱数で 生成します。このデータに対して4つのモデル (A)等分散、等平均 :EqMVと略 (B)等分散(平均は異なってもよい):EqVと略 (C)等平均(分散は異なってもよい):EqMと略 (D)平均、分散とも異なってもよい :Freeと略 を設定してAICを求めます。 上のN個のデータを2組とって(A)〜(D)のモデルに対してAICを求める ということを10000回繰り返して分布やエラーの比率を調べました。 サンプル数Nは大きくない場合も調べました。 まず、N=5の場合のAICの分布を最小値(Min)、第1四分位数(Q1)、 中央値(Med)、第3四分位数(Q3)、最大値(Max)によって表わすと次の ようになります。 Free... Mix = -13.2698883 Q1 = 9.65064385 Med = 13.5647411 Q3 = 16.9978785 Man = 29.066486 EqM... Mix = -14.2131911 Q1 = 9.85320524 Med = 13.6467059 Q3 = 17.2900318 Man = 61.1999055 EqV... Mix = -14.1703251 Q1 = 9.29384774 Med = 12.8960932 Q3 = 16.2215558 Man = 28.0054322 EqMV... Mix = -15.7698665 Q1 = 8.74434656 Med = 12.2543754 Q3 = 15.2966734 Man = 26.0838942 個々のAICの値はかなりの範囲で変動しています。 AICでモデルの選択を行うときは、与えられたデータに対する 各モデルのAIC値の大小関係が問題になります。モデルEqM、 EqV、FreeとEqMVとのAIC値の差の分布を調べてみます。また、 モデルEqM、EqV、FreeのAICよりEqMVのAICの方が小さい値になった 場合の頻度を調べて%単位で表わしてみます。モデルの選択に おいてはAICの値の小さい方が適切なモデルとして選択されます。 <EqM> - (EqMV)> (VEqM > VEqMV) ==> 79.4 Mix = -16.0193653 Q1 = 0.368970682 Med = 1.53296217 Q3 = 1.94381736 Man = 51.3936376 <EqV> - (EqMV)> (VEqV > VEqMV) ==> 78.0 Mix = -20.8327767 Q1 = 0.242387999 Med = 1.39375234 Q3 = 1.86576737 Man = 2 <Free> - (EqMV)> (Free > VEqMV) ==> 76.3 Mix = -22.0911978 Q1 = 0.151189604 Med = 2.08564629 Q3 = 3.21655972 Man = 3.99987302 AICの差の分布は個々の値ほど大きくないことがわかります。 しかし、EqMVのAICの方が小さい値である比率は80%弱です。 EqMVが正しいモデルであることを考えると、EqMVのAICの方が 小さくないということは第1種のエラーと考えられますので、 上のことはAIC基準で判断を行うと第1種のエラーの確率が20% 以上であるということを示していることになります。 AICで検定を行うときは、上の(A)〜(D)の4つのモデルの 内から最小のAICであるものを選びます。EqMVのAICが4つの モデルの中で最小であった場合の比率は59.8%でした。 (EqMV) is Best> (EqMV:Best) ==> 59.8 第1種のエラーの確率は約40%ということになります。 N=200の場合は、 Free... Mix = 291.834267 Q1 = 384.600225 Med = 404.538566 Q3 = 423.292548 Man = 493.651225 EqM... Mix = 290.131264 Q1 = 383.611217 Med = 403.347487 Q3 = 422.20114 Man = 492.652126 EqV... Mix = 289.835342 Q1 = 383.467976 Med = 403.5553 Q3 = 422.250363 Man = 498.874555 EqMV... Mix = 288.132339 Q1 = 382.645121 Med = 402.398896 Q3 = 421.133536 Man = 497.562759 個々のAICの値の分布の範囲はN=5の場合よりも広く なっています。 EqMVとの差の分布の範囲はN=5の場合と同じく それほど広くはありません。 <EqM> - (EqMV)> (VEqM > VEqMV) ==> 84.3 Mix = -13.604824 Q1 = 0.69159102 Med = 1.54722851 Q3 = 1.90062551 Man = 1.9999999 <EqV> - (EqMV)> (VEqV > VEqMV) ==> 84.5 Mix = -11.8685986 Q1 = 0.684974648 Med = 1.56107866 Q3 = 1.9077688 Man = 2 <Free> - (EqMV)> (Free > VEqMV) ==> 86.6 Mix = -17.043952 Q1 = 1.25809992 Med = 2.62335166 Q3 = 3.4326055 Man = 3.99999186 第1種のエラーの確率は約30%です。 (EqMV) is Best> (EqMV:Best) ==> 71.4 上のシミュレーションでは4つのモデル(A)〜(D)はいずれも 真のモデルとは矛盾しません。パラメータが多すぎるというだけ です。選択対象のモデル群に真のモデルと矛盾するものがある 場合の様子は上の場合と異なってくると思います。 上のシミュレーションで用いたプログラムは http://www.users.kudpc.kyoto-u.ac.jp/~e50048/simuaic/ にあります。 金沢大学文学部 岡本安晴
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。