[fpr 1488] 納涼・因子分析(または夏休みの自由課題)

堀啓造

堀@香川大学経済学部です。

山口和憲さん@立教大学のサイトでおもしろいデータがあります。
http://ir.sr.rikkyo.ac.jp/~yamaguchi/lec/ma99/can/index.html

ここにある,「マクロを含むシートをダウンロード」のダウンロード
1996年日本プロ野球の打撃成績のデータがあります。excel ファイルです。

主成分分析のデータ例になってますが,因子分析をしてみると悩ましいデータ
となっています。

(0)「最小二乗法」(「反復主因子法」)または「最尤法」による因子分析をす
る。

(1)固有値1以上の基準を使うと4因子。また,因子数に対して厳しい基準の
MAP(主成分分析用)でも4因子です。ということで本来なら4因子でもいいは
ずのデータです。

(2)ところが,実際に13変数をすべて使うと,4因子解も3因子解も不適解で
す。2因子解でやっと(0)の解がもとまります。

(3)しかし,ある変数を除いて12変数を因子分析すると,4因子解でも不適解
にはなりません。

そこで,問題
(a)その変数を見つけるのにはどのような指標を使うのか?
 おそらくこれは1つとは限らないでしょうね。
 この設定は,変数を一つずつ落として試してみるという真っ当な方法は除外
します。
 すでに作成されている指標,または新たに作成した指標です。

(b)13変数で不適解が生じる理由は?

私もよく分かっていないのですが,1つ2つ思いあたることがあるという程度
です。もし,その理由が当たっていればおもしろいのだけど。

(a)(b)一方でも答えがわかれば教えてください。

サンプル数は68です。
データの相関行列はめちゃくちゃですが
次のようになります。(なるべく元のデータに当たってください)
1.000	0.222	0.445	0.732	0.422	-0.045	0.152	0.362	0.199
	0.113	-0.199	0.041
0.222	1.000	0.550	0.824	0.548	0.090	0.156	0.316	0.143
	0.139	0.251	0.194
0.445	0.550	1.000	0.641	0.417	0.015	0.469	0.498	0.528
	0.411	0.324	0.285
0.732	0.824	0.641	1.000	0.632	0.038	0.192	0.426	0.206
	0.155	0.051	0.160
0.422	0.548	0.417	0.632	1.000	-0.062	0.280	0.495	0.182
	0.094	0.179	-0.085
-0.045	0.090	0.015	0.038	-0.062	1.000	-0.301	-0.245	-0.152
	0.113	-0.066	0.569
0.152	0.156	0.469	0.192	0.280	-0.301	1.000	0.843	0.506
	0.171	0.659	-0.297
0.362	0.316	0.498	0.426	0.495	-0.245	0.843	1.000	0.472
	0.245	0.514	-0.272
0.199	0.143	0.528	0.206	0.182	-0.152	0.506	0.472	1.000
	0.166	0.382	-0.091
0.113	0.139	0.411	0.155	0.094	0.113	0.171	0.245	0.166
	1.000	0.258	0.306
-0.199	0.251	0.324	0.051	0.179	-0.066	0.659	0.514	0.382
	0.258	1.000	0.007
0.041	0.194	0.285	0.160	-0.085	0.569	-0.297	-0.272	-0.091
	0.306	0.007	1.000


--------------------------------------------------------------
変数選択のとき,
狩野さん,原田さんの
Stepwise Variable Selection in Factor Analysis
http://koko15.hus.osaka-u.ac.jp/~harada/factor/tutorial/

を使って見るのもいいでしょう。

ここで1変数だけを削除するなら問題ないのですが,最適の変数群を求めよう
とするとまるでタマネギの皮むき状態になります。(これが「納涼」)

それにしてもこんなに不適解がでまくってもいいものなのでしょうか。


変数名
x1='打率'
x2='ゲーム数'
x3='打席数'
x4='得点'
x5='安打'
x6='2B'
x7='3B'
x8='HR'
x9='打点'
x10='四球'
x11='死球'
x12='三振'
x13='盗塁'

 

----
堀 啓造(香川大学経済学部)e-mail:  hori (at) ec.kagawa-u.ac.jp
home page http://www.ec.kagawa-u.ac.jp/~hori/
電話番号 087-832-1894(直通) fax 087-832-1820(事務室)
〒760-8523(これで香川大学経済学部)


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。