堀@香川大学経済学部です。 狩野・千野さん主催のシンポで偏相関が注目されていることを知りまし た。その中の椿・椿さんの講演にとても興味を持ちました。 宮川『グラフィカル・モデリング』朝倉書店(1997)の10種競技のデータ の分析です。椿さんは強く否定するのですが,主成分分析では一見うまく いくようだけど,実はそれは間違っているということです。 そこで,早速データを入れて分析してみました。 title "近代10種競技 宮川(1997) p2". matrix data variable=R100 JHaba Hogan JTaka R400m H110m Enban JB OC Yari R1500m /format=free/n=50/contents=corr. begin data. 1 -0.221 1 -0.085 0.175 1 0.024 0.306 0.112 1 0.467 -0.119 -0.279 0.095 1 0.355 -0.247 -0.183 -0.193 0.465 1 0.082 0.042 0.822 -0.029 -0.172 -0.127 1 -0.024 0.366 0.287 0.037 -0.183 -0.258 0.324 1 0.002 0.032 0.568 0.109 -0.379 -0.157 0.446 0.23 1 -0.178 -0.052 -0.132 0.09 0.205 0.031 -0.081 0.008 -0.085 1 end data. factor matrix=in(cor=*)/print=all/criteria=factors(2) /extractio=ml/rotatio=promax(3). 相関行列は椿さんの数値を丸めました。 偏相関をキーに考えると,MAP とKMO が浮かびます。 とりあえず因子数はMAP=2, PA-smc-M and 95 3 と2〜3因子です。 KMOを見ると主成分分析が失敗するのも当然というデータです。 全体のKMO =0.557 ときわめてよくありません。 0.5以下ならば不可の データです。 個別変数を見ると, R100 .420 JHaba .532 Hogan .574 JTaka .355 R400m .582 H110m .699 Enban .557 JBOC .643 Yari .674 R1500m .267 となっていて, R100, JTaka, R1500m は無条件で使えません。他の変数 をみても主成分分析・因子分析向きのデータでないことは明かです。大 抵,KMO は見ないのでこれを無視してしまいます。Kaiser の偉大な業績 の一つです。 第10固有値が .12613894ですので共線性はないといったほうがいいで しょう。 いずれにしてもこのデータは主成分分析・因子分析において忘れらててい た問題を思い起こさせるものとしていい例となってます。 ---- 堀 啓造(香川大学経済学部) home page http://www.ec.kagawa-u.ac.jp/~hori/
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。