[fpr 2532] 変数が観測数より多い場合のPCA,FA

Shigekazu Ishihara

岸本さん

さっそくお返事ありがとうございました.

>実対称行列の固有値問題を解くとき、ヤコビ法のような博物館級の
>古典的方法を採用しようとするプロのソフトウェア開発者はいない
>でしょう(学生の皆様には、歴史を学ぶ価値はありますが)。
>
>FAの解法について、米国SAS社の教育では、
>・ 相関行列が非特異なときはML
>・ 相関行列が特異なときはULS
>を通常採るべだとしていました。もちろん、相関行列が特異に
>なるのは観測数が少ないときだけではありませんが。

MLは最尤推定でしょうか.
ULSは調べたらでてきましたが,算法まではわかりませんでした.
まあ,モダンな方法をつかえということでしょうか.
なお,SASは持っていませんが,同じアルゴリズムを使っていると
おもわれるJMPだと,確かにサンプル数が少なくても平気でPCAをやります.

脱線ついでに,Mathematicaも固有値固有ベクトルを求めてくれますが,
問い合わせるとQR法をつかっているということでした.
それなら,計算精度の問題で解決するという部分もあるのかな.

で,私がまた引っ掛かっているのは,どういうときに相関行列が特異に
なりやすい(ランク落ちするとイコールと考えていいでしょうか)かと
いうことです.
さきほどもあいまいに書きましたが,p次元空間内でサンプル数がp以下だと,
一次従属しているp次元ベクトルがある,
サンプル数が十分多ければ,
一次従属しているp次元ベクトルは,すくなくなる(はずだと期待される)
ということでしょうか.

>要は、相関行列が特異であることを理由にFAをあきらめる必要
>はありません。PCAについても同様です。観測数が少ないとき
>FA, PCAがやりにくいのは、やはり推定値の安定性の問題だと
>思います。
やっぱりそういうことでしょうか.
話はもどりますが,Chemometricsでは,ほんとに
小サンプルサイズでも怒られないのか,気になります.
実は我々のやっている,SD法による商品の評価では
サンプル数よりも評価語のほうが多くなることはしばしばあります.
PCAができて,それなりに納得できる結果でも
さすがにそれをそのまま論文に載せることは躊躇しているのですが.

>回帰分析の枠では、変数が観測数より少ない場合PLSが広く使われて
>います。回帰係数に興味がなく、予測にのみ興味がある(化学合成物の
>性質など)場合ならこれでいいわけです。
一方,回帰分析を使う場面でもサンプル数が少ないケースはありまして,
PLSは面白そうなのですが,こちらは回帰係数に興味があるので,
見送っている次第です.

石原茂和
広島国際大学 人間環境学部 感性情報学科
724-0695 広島県賀茂郡黒瀬町学園台555-36
tel:0823-70-4890 fax:0823-70-4852
e-mail: i-shige (at) he.hirokoku-u.ac.jp


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。