[fpr 319] PCA of HALBAU

堀啓造

堀 啓造@香川大学経済学部です。

Tokuhisa Suzuki <KGH00763 (at) niftyserve.or.jp> さんは書きました:[fpr 315]
>鈴木@日経リサーチです.

どうも、コメントありがとうございます。楽しく読ませてもらいました。

私は因子分析や主成分分析の歴史をたどったことがないので、以下のことは大間違いのこ
んこんちきかもしれませんが、ちょっと考えてみました。

(1)loading は因子分析から発展した考えであった。だから、主成分分析にこの考えを適
用するのは、応用的な適用である。

(2)因子分析では因子パタンの重みを本来、因子負荷といっていた。

(3)因子パタンという概念とは別に、因子構造という概念がある。(因子構造とは、各因
子と各変量との相関のことである(芝祐順1979因子分析法第2版p13))

(4)最初のころは直交回転しかなかったので、(2)(3)は同じことになった。
→因子負荷を相関と考える考え方が普及する。というよりも相関が因子負荷量だと思われ
るようになった。

(5)斜交回転がでてきて、因子パタンと因子構造がはっきりと分離して意識するようにな
ってきた。因子構造のほうに因子負荷量のことばが残った。

(6)因子分析の概念から主成分分析の概念を見直した。主成分分析は本来分散共分散行列
を分析するもの。(因子分析の考えを適用して相関行列からの出発も考えられる)

(7)そうすると、分散共分散行列の主成分分析の構造ベクトルは相関ではなく共分散を使
うべきもの。(これは、因子分析そのものが本来相関行列から出発しているから、標準化
したデータ行列をもとにしていると考えれば、共分散になっている。)

(8)主成分分析の(主成分)構造とは共分散を係数とする。

と、より一般的な解釈とすることができる。

しかし、ユーザにとって共分散を係数とするメリットはそれほどないようです。とりわけ
それが最初の分析の場合、主成分を解釈するときに使いにくい。ほかの類似の分析がある
ときは利用できるかもしれません。

>HALBAUの主成分得点はいつでも平均0、分散1に基準化されます.これはマニ
>ュアルにも明記してあります.分散共分散行列を分析した場合でさえ分散1に
>基準化します.初心者は主成分得点の分散は固有値に基準化するものだと勉強
>するはずです.相関行列を分析した場合でさえ、分散は固有値に基準化するも
>のだと、本屋で売っている多くの本に書いてあります.私は教室で統計学を勉
>強したことがないので、違っているかも知れません手に入る本を読んで勉強
>した印象ではそうです.

このあたりは数量化と似たところですね。標準得点を使えば異常値をすぐ見つけられると
いうメリットがあります。

>主成分分析は、本質的には分散共分散行列から出発すべきだというコンセプト
>は、主成分負荷量に相関でなく、共分散を出力するという形で頂点に達したあ
>と、プログラミングが進む過程で、いつしか標準化という「多くの場合の処
>理」に紛れてしまったかのようです.そのズレに落とし穴ができて初心者を呼
>び込むことになった.初心者はここで学ぶ.「どんな基準化でもいいというこ
>となんだな.大きさは比例関係だし、解釈を間違えることもないからな」と.

主成分得点についてはそうですが、主成分負荷量については、大きさだけでなく、関係も
違っています。固有ベクトルとなら大きさの違いになりますが。


>やや勝手な感想です、私は柳井氏は書かれたものを通してしか知りませんの
>で、ひょとしたら違うお考えかも知れませんが.

柳井晴夫(1994)多変量データ解析法 朝倉書店
p33 では主成分分析は相関行列をもっぱら使用しています。単位が異なるモノが多いか
らそういうことになったのかな。もちろん、「相関係数行列(または分散共分散行列)」
という記述もみられ、決して分散共分散行列を引っ込めたわけではありません。

香川大学経済学部
        堀 啓造
hori (at) ec.kagawa-u.ac.jp

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。