[fpr 1489] 納涼・因子分析夏休みの自由課題)

狩野裕

狩野@大阪大学です

山口さんのデータをさわったわけではないのですが,一般的なコメントをします.
汎用パーケージで因子分析すると「共通性が1を越えました」というメッセージを
はいて,ソフトが止まることがあります.これを不適解またはヘイウッドの場合と
いい,古くから因子分析の問題として指摘されています.

因子分析における不適解にはいくつかの原因があります
1.本来は適解であるが標本変動によって運悪く不適解になってしまった.
2.因子分析モデルに内在する問題(識別性)によって不適解が発生した.例え
ば,因子数が大きすぎる場合.
3.本来因子分析するのには適した状況でない.つまり,因子分析モデルが当ては
まっていない.
4.データに問題がある.外れ値などの影響で相関係数をうまく推定できていな
い.標本サイズnが小さく相関係数を適切に推定できていない.

不適解に出会ったとき,難しいのですが,まず,原因同定を行います.上記1が原
因であると判断された場合は,1を越えた共通性を=1とおいて再分析します.S
ASでは,heywood というオプションをつけます.原因2と3の場合は,因子数を
小さくしたり,変数を削って再分析します.4で外れ値が原因の場合は,外れ値を
とり除くことで対処できます.

山口さんのデータでの不適解の原因同定は試みていませんが,「3.モデルが適切
でない」+「4.標本サイズが小さい」が原因ではないかと予想しています.もし
かすると,変数変換が必要かもしれません.

狩野+原田の因子分析における変数選択プログラムは,まだ,不適解に対応してい
ません.現在,鋭意努力中であります.9月の日本心理学会(中京大学)で変数選
択のワークショップを持ち,議論することになっていますが,それまでに,プログ
ラムが開発され,不適解の原因同定に使えるということになればと考えています.
http://www.cnc.chukyo-u.ac.jp/users/jpa99/workshop/abst.html#18

○●○●○●○●○●○●○●○●○●○●
狩野  裕 大阪大学人間科学部
 〒565-0871 吹田市山田丘1−2
 Phone/Fax:06-6879-8052
 http://koko15.hus.osaka-u.ac.jp/~kano/
○●○●○●○●○●○●○●○●○●○●



In message 
<199908141008.AA00905 (at) 133.92.94.41.ns2.kagawa-u.ac.jp.ec.kagawa-u.ac.jp>
   "[fpr 1488] 納涼・因子分析(または夏休みの自由課題)"
   "Keizo Hori <hori (at) ec.kagawa-u.ac.jp>" wrote:

> 堀@香川大学経済学部です。
> 
> 山口和憲さん@立教大学のサイトでおもしろいデータがあります。
> http://ir.sr.rikkyo.ac.jp/~yamaguchi/lec/ma99/can/index.html
> 
> ここにある,「マクロを含むシートをダウンロード」のダウンロード
> 1996年日本プロ野球の打撃成績のデータがあります。excel ファイルです。
> 
> 主成分分析のデータ例になってますが,因子分析をしてみると悩ましいデータ
> となっています。
> 
> (0)「最小二乗法」(「反復主因子法」)または「最尤法」による因子分析をす
> る。
> 
> (1)固有値1以上の基準を使うと4因子。また,因子数に対して厳しい基準の
> MAP(主成分分析用)でも4因子です。ということで本来なら4因子でもいいは
> ずのデータです。
> 
> (2)ところが,実際に13変数をすべて使うと,4因子解も3因子解も不適解で
> す。2因子解でやっと(0)の解がもとまります。
> 
> (3)しかし,ある変数を除いて12変数を因子分析すると,4因子解でも不適解
> にはなりません。
> 
> そこで,問題
> (a)その変数を見つけるのにはどのような指標を使うのか?
>  おそらくこれは1つとは限らないでしょうね。
>  この設定は,変数を一つずつ落として試してみるという真っ当な方法は除外
> します。
>  すでに作成されている指標,または新たに作成した指標です。
> 
> (b)13変数で不適解が生じる理由は?
> 
> 私もよく分かっていないのですが,1つ2つ思いあたることがあるという程度
> です。もし,その理由が当たっていればおもしろいのだけど。
> 
> (a)(b)一方でも答えがわかれば教えてください。
> 
> サンプル数は68です。
> データの相関行列はめちゃくちゃですが
> 次のようになります。(なるべく元のデータに当たってください)
> 1.000	0.222	0.445	0.732	0.422	-0.045	0.152	0.362	0.199
> 	0.113	-0.199	0.041
> 0.222	1.000	0.550	0.824	0.548	0.090	0.156	0.316	0.143
> 	0.139	0.251	0.194
> 0.445	0.550	1.000	0.641	0.417	0.015	0.469	0.498	0.528
> 	0.411	0.324	0.285
> 0.732	0.824	0.641	1.000	0.632	0.038	0.192	0.426	0.206
> 	0.155	0.051	0.160
> 0.422	0.548	0.417	0.632	1.000	-0.062	0.280	0.495	0.182
> 	0.094	0.179	-0.085
> -0.045	0.090	0.015	0.038	-0.062	1.000	-0.301	-0.245	-0.
152
> 	0.113	-0.066	0.569
> 0.152	0.156	0.469	0.192	0.280	-0.301	1.000	0.843	0.506
> 	0.171	0.659	-0.297
> 0.362	0.316	0.498	0.426	0.495	-0.245	0.843	1.000	0.472
> 	0.245	0.514	-0.272
> 0.199	0.143	0.528	0.206	0.182	-0.152	0.506	0.472	1.000
> 	0.166	0.382	-0.091
> 0.113	0.139	0.411	0.155	0.094	0.113	0.171	0.245	0.166
> 	1.000	0.258	0.306
> 
-0.199	0.251	0.324	0.051	0.179	-0.066	0.659	0.514	0.382
> 	0.258	1.000	0.007
> 0.041	0.194	0.285	0.160	-0.085	0.569	-0.297	-0.272	-0.091
> 	0.306	0.007	1.000
> 
> 
> --------------------------------------------------------------
> 変数選択のとき,
> 狩野さん,原田さんの
> Stepwise Variable Selection in Factor Analysis
> http://koko15.hus.osaka-u.ac.jp/~harada/factor/tutorial/
> 
> を使って見るのもいいでしょう。
> 
> ここで1変数だけを削除するなら問題ないのですが,最適の変数群を求めよう
> とするとまるでタマネギの皮むき状態になります。(これが「納涼」)
> 
> それにしてもこんなに不適解がでまくってもいいものなのでしょうか。
> 
> 
> 変数名
> x1='打率'
> x2='ゲーム数'
> x3='打席数'
> x4='得点'
> x5='安打'
> x6='2B'
> x7='3B'
> x8='HR'
> x9='打点'
> x10='四球'
> x11='死球'
> x12='三振'
> x13='盗塁'
> 
>  
> 
> ----
> 堀 啓造(香川大学経済学部)e-mail:  hori (at) ec.kagawa-u.ac.jp
> home page http://www.ec.kagawa-u.ac.jp/~hori/
> 電話番号 087-832-1894(直通) fax 087-832-1820(事務室)
> 〒760-8523(これで香川大学経済学部)
> 
> 


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。