[fpr 2531] 変数が観測数より多い場合のPCA,FA

Shigekazu Ishihara


狩野さん,さっそくお返事ありがとうございました.

まず,訂正ですが,
昨日の私の書いたところで
>>ヤコビ法のなかでランク落ちにより
>>逆行列が求められないという昔聞いた話で,ふーんと思っていたのですが,

Jacobi法の計算には逆行列はつかいません.
Numerical recipes in Cを見てみました.
(いや,あれは逆行列の計算なんだということがあれば
ご指摘ください)

ということで,お書きいただいたように,
>ご指摘のように,標本相関行列(共分散行列)がランク落ちして逆行列を求める
>ことができません.しかし,このことはPCAを実行できるかどうかとは無関係で,
>実際,このようなときでもPCAを実行することが出来ます.
ということになるわけですね.

>ソフトウェアの開発者の意図を正確に見抜くことは出来ませんが,以下のような
>ことが考えられます.因子分析をするときにはしばしば,事前共通性の推定値に
>重相関係数の2乗(SMC)を使います.SMCを計算する際相関行列の逆行列を利用す
>る有用な公式があり,多くのプログラムでその公式が用いられています.また,
>推定値を計算するときも,最尤法や一般化最小2乗法を用いるときは,相関行列
>がランク落ちしていてはいけません.そこで,因子分析・主成分分析を実行する
>ときには,最初に,SMCが計算できるように,推定が正しく出来るように,相関
>行列がランク落ちしていないかどうかをチェックすることが多いのです.

SMCの計算用ですか.
柳井・繁桝・前川・市川,因子分析その理論と方法,朝倉書店
の37ページに,その方法を発見しました.なるほど,これだと最初から逆行列を使い
ますね.

>しかし,PCAでは相関行列のランク落ちは関係ありませんし,SMCを求めるときも
>相関行列の逆行列を使わない求め方があります.また,因子分析で,反復主因子
>法や最小2乗法を使えば,相関行列がランク落ちしていても推定値を計算できる
>ことがあります.

ここまでお教え頂いて,変数の数pがサンプル数よりも多い場合にPCAを
やってもいいのかという,当初の私の疑問については,
計算上は可能である,ただし解の安定性についてはよろしくない
ということになるのかなと了解しました.

もっと基本的な疑問としては,pよりサンプル数が少ないと,
なぜ相関行列のランクが落ちるのかがまだ納得できていません.
これも幾何学的な解釈でいいのかな・・
(p次元空間でpよりサンプルが少ないと,それを説明するのにp次元もいらない)
その先の,ランクが次元数より落ちると特異行列になり,行列式が0になり,
逆行列も求められないというのは納得できるのですが.

別の話ですが,自分の使っているソフトはpよりサンプル数が少ないと,
PCAのときに特異行列だから計算しないと言ってくるという話を聞いたのですが
これはヤコビ法をつかっていないのかな.QR法も逆行列をつかってなさそうなのだけ
れども.

石原茂和
広島国際大学 人間環境学部 感性情報学科
724-0695 広島県賀茂郡黒瀬町学園台555-36
tel:0823-70-4890 fax:0823-70-4852
e-mail: i-shige (at) he.hirokoku-u.ac.jp


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。