[fpr 1339] 因子分析のサンプル数

堀啓造

堀@香川大学経済学部です。

Re:[fpr 1333] Re: 因子分析のサンプル数
自己フォローです。

>re:[fpr 1324] 
>Kazuhito Yokoyamaさん wrote ;
>
>>因子分析に最低必要なサンプルサイズについては経験的に
>>抽出因子数の3〜10倍と言われているようですが、自分の
>>論文中に、査読者の指摘に応じて、この点を明示した英語
>>の原著論文ないし総説を引用しようと思って、はたと困っ

Guadagnoli,E.,& Velicer,W.F.(1988) Stability of component patterns: A simulation 
study.Psychological Bulletin, 103, 265-275.

http://www.uri.edu/research/cprc/Publications/Authors/Abstracts/guadag01.htm

が変数とサンプル数の関係を徹底的にレビューしているそうです。この関係については実
証的研究はないとのこと。それでもって、彼らの研究から関係はないといえる。
この論文に言及している
Stevens,J.(1996)Applied multivariate statistics for the social sciences. 3rd ed. 
LEA.
では、変数の数とサンプル数の関係について前の版で言及したことを悔い改めている。
p372

Velicer,W.F., & Fava,J.L.(1998). Effects of variable and subject sampling on 
factor pattern recovery. Psychological Methods, 3(2), 231-235.

APA のサイトのアブストラクトにリンクしようと思ったら、最新号しかアブストラクトを
付けないようですね。APAの会員もしくは(今年から)外国準会員であればwww 上で 
PsycLit をみることができます。

http://members.apa.org/welcome/


ここでは、前の研究よりも包括的なシミュレーションをしている。分析法も主成分分析だ
けでなく最尤法とimage component analysis を加えている。結果としては1988年の研究
を支持するものとなっている。

因子抽出に重要なのは (% は説明できた分散のパーセント)
負荷量    44%  (.40,.60,.80 の3条件)(各変数平均というか母負荷量固定)
被験者数  23%  (50,100,150,200,400,800 の6条件)
負荷量×被験者数 11%
変数数    12%  (18, 24, 30) 因子数は6に固定 
-----以下小さい効果
変数数×負荷量  2%
処理法     2%  (PCA,ICA,MLFA)
処理法×被験者数 2%
処理法×負荷量 1%

グラフなどをみても200人は必要なようです。ただし、高負荷量(.80)条件(平均が.80
だから実現はなかなかできないでしょう)のときは100人でもほかの800人条件よりい
いので、この限りではない。低負荷量のときは被験者数を多くするのも、変数の数を増や
すのも効果がある。

また因子数と被験者数は関係なさそうです。少なくとも重要な関係はない。

ほかに不適解頻度の分析から1因子3変数は必要。不適解のときは因子数を少なくする診
断として使う。
150回で収束しないときの分析から高負荷量で、被験者数が多くて変数数が少ないときに
起こりやすい。
などおもしろい知見や尺度構成のための示唆を与えています。

ただ、この論文ははっきりした数字の誤植がいくつもあって、数字を信用できないのが難
点です。


----
堀 啓造(香川大学経済学部)e-mail:  hori (at) ec.kagawa-u.ac.jp
home page http://www.ec.kagawa-u.ac.jp/~hori/
1999年4月1日から wwwサーバーは、www に統一されます。fourierはメールサーバー専用に変身。いまもwww が使えるので 上のurl を使ってください。
電話番号 087-832-1894(直通) fax 087-832-1820(事務室)
〒760-8523(これで香川大学経済学部)


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。