[fpr 2484] グラフィカルモデリングと因子分析

堀啓造

堀@香川大学経済学部です。

狩野・千野さん主催のシンポで偏相関が注目されていることを知りまし
た。その中の椿・椿さんの講演にとても興味を持ちました。

宮川『グラフィカル・モデリング』朝倉書店(1997)の10種競技のデータ
の分析です。椿さんは強く否定するのですが,主成分分析では一見うまく
いくようだけど,実はそれは間違っているということです。

そこで,早速データを入れて分析してみました。
title "近代10種競技 宮川(1997) p2".
matrix data 
variable=R100	JHaba	Hogan	JTaka	R400m	H110m	Enban	JB
OC	Yari	R1500m	
/format=free/n=50/contents=corr.
begin data.
1 
-0.221  1
-0.085  0.175  1
0.024  0.306  0.112  1
0.467  -0.119  -0.279  0.095  1
0.355  -0.247  -0.183  -0.193  0.465  1
0.082  0.042  0.822  -0.029  -0.172  -0.127  1
-0.024  0.366  0.287  0.037  -0.183  -0.258  0.324  1
0.002  0.032  0.568  0.109  -0.379  -0.157  0.446  0.23  1
-0.178  -0.052  -0.132  0.09  0.205  0.031  -0.081  0.008  -0.085  
1
end data.
factor matrix=in(cor=*)/print=all/criteria=factors(2)
    /extractio=ml/rotatio=promax(3).

相関行列は椿さんの数値を丸めました。

偏相関をキーに考えると,MAP とKMO が浮かびます。
とりあえず因子数はMAP=2, PA-smc-M and 95 3
と2〜3因子です。

KMOを見ると主成分分析が失敗するのも当然というデータです。
全体のKMO =0.557 ときわめてよくありません。 0.5以下ならば不可の
データです。
個別変数を見ると,

R100 .420
JHaba .532
Hogan .574
JTaka .355
R400m .582
H110m .699
Enban .557
JBOC  .643
Yari  .674
R1500m .267

となっていて, R100, JTaka, R1500m は無条件で使えません。他の変数
をみても主成分分析・因子分析向きのデータでないことは明かです。大
抵,KMO は見ないのでこれを無視してしまいます。Kaiser の偉大な業績
の一つです。

第10固有値が .12613894ですので共線性はないといったほうがいいで
しょう。

いずれにしてもこのデータは主成分分析・因子分析において忘れらててい
た問題を思い起こさせるものとしていい例となってます。

----
堀 啓造(香川大学経済学部)
home page http://www.ec.kagawa-u.ac.jp/~hori/

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。