堀 啓造@香川大学経済学部です。 Tokuhisa Suzuki さんは書きました:[fpr 264] >>>多重対応分析の場合、 >>>大隅昇るほか(1994)記述的多変量解析法 日科技連 >>>p159-160 では「すべての質問が2つの反応カテゴリーからなるときには、 多重解析 >>>は各質問の2つのカテゴリーの中の一つのカテゴリーだけに注目した主成 分分析に >>>すぎない」ということを証明しています。 > > 3類は意外に(数理的にも実用的にも)難しく思います.それこそ1週間 ま >とめて会社を休んで,本と論文とパソコンに向かって勉強したい気持ちです . >私は実際に自分でIMLかなんかで書きながらやってみないと理解できないので >勉強してみますが,ソフトウエアの出力でも確認できますか?,サンプル数 量 >と主成分が同値になるわけですよね.対称行列の特異値分解と,一般のデー タ >行列の特異値分解との違い位があるかと想像していました.堀さんの作られ た >SPSSの3類マクロの研究成果に期待を寄せています.2値変数の2カテゴリ の >扱いの問題は参考書にあまり詳しく書いてないように思いますが,数年前に 西 >里先生が行動計量学で論文を書いていた記憶があります. これは読んでいません。SASが動いたので、数値的に確認しました。長いで すが、サンプルプログラムとともに結果の見方を同封します。 2値型データの対応分析と主成分分析 2値型データを主成分分析をしてみる。 データはHoffman,D.L. and Franke,G.R. 1986 Correspondence analysis: Graphical representation of categorical data in marketing research. Journal of Marketing Research, 23(Aug),213-27. also in P.E.Green et al.(1989) Multidimensional Scaling. Allyn and Bacon.のソフトドリンクを この1週間の購入と消費。 (1)データの主成分分析。(SAS) data soft8; input num cokeo dietco dietpo diet7o pepsio spriteo tabo up7o ; cards; 1 1 0 0 0 1 1 0 1 2 1 0 0 0 1 0 0 0 3 1 0 0 0 1 0 0 0 4 0 1 0 1 0 0 1 0 5 1 0 0 0 1 0 0 0 6 1 0 0 0 1 1 0 0 7 0 1 1 1 0 0 1 0 8 1 1 0 0 1 1 0 1 9 1 1 0 0 0 1 1 1 10 1 0 0 0 1 0 0 1 11 1 0 0 0 1 1 0 0 12 0 1 0 0 0 0 1 0 13 0 0 1 1 0 1 0 1 14 1 0 0 0 0 1 0 0 15 0 1 1 0 0 0 1 0 16 0 0 0 0 1 1 0 0 17 0 1 0 0 0 1 0 0 18 1 1 0 0 1 0 0 0 19 1 0 0 0 0 0 0 1 20 1 1 1 0 1 0 0 0 21 1 0 0 0 1 0 0 0 22 1 0 0 0 1 0 0 0 23 0 1 0 1 0 0 1 0 24 1 1 0 0 1 0 0 0 25 0 1 1 1 0 0 0 0 26 0 1 0 1 0 0 1 0 27 0 1 0 0 0 0 1 0 28 1 0 0 0 0 1 0 1 29 1 0 0 0 0 1 0 0 30 0 1 1 0 0 0 1 0 31 1 0 0 0 1 0 0 1 32 0 1 1 0 0 0 1 0 33 1 0 0 0 1 0 0 1 34 0 1 1 1 0 0 1 0 ; proc factor nfact=3 data=soft8 preplot ; var cokeo -- up7o; run; (2)対応分析の場合、これに飲まなかった場合の該当、非該当を入れて列が倍 になる。 data soft; input num cokeo cokex dietco dietcx dietpo dietpx diet7o diet7x pepsio pepsix spriteo spritex tabo tabx up7o up7x ; cards; 1 1 0 0 1 0 1 0 1 1 0 1 0 0 1 1 0 (中略) proc corresp dimens=3; var cokeo -- up7x ; run; (a)主成分分析(3因子にしているのは元の論文が3因子のため) (a-1) Eigenvalues of the Correlation Matrix: Total = 8 Average = 1 1 2 3 4 Eigenvalue 3.8540 1.2114 0.7936 0.7095 Difference 2.6425 0.4179 0.0841 0.1023 Proportion 0.4817 0.1514 0.0992 0.0887 Cumulative 0.4817 0.6332 0.7324 0.8211 (a-2) Initial Factor Method: Principal Components Factor Pattern FACTOR1 FACTOR2 FACTOR3 COKEO -0.88627 -0.13329 0.07592 DIETCO 0.78369 -0.13768 -0.17552 DIETPO 0.63560 0.03636 0.48826 DIET7O 0.67680 0.22182 0.34464 PEPSIO -0.74162 -0.47644 0.18420 SPRITEO -0.38630 0.73031 -0.37997 TABO 0.84395 0.00213 -0.19842 UP7O -0.42521 0.60319 0.42678 Variance explained by each factor FACTOR1 FACTOR2 FACTOR3 3.853960 1.211443 0.793567 (b)対応分析 (b-1) Inertia and Chi-Square Decomposition Singular Principal Chi- Values Inertias Squares Percents 10 20 30 40 50 ----+----+----+----+----+--- 0.69408 0.48174 131.035 48.17% ************************ 0.38914 0.15143 41.189 15.14% ******** 0.31495 0.09920 26.981 9.92% ***** 0.29780 0.08869 24.122 8.87% **** 0.27550 0.07590 20.645 7.59% **** 0.22158 0.04910 13.355 4.91% ** 0.17410 0.03031 8.245 3.03% ** 0.15374 0.02363 6.429 2.36% * ------- ------- 1.00000 272 (Degrees of Freedom = 495) (b-2) Column Coordinates Dim1 Dim2 Dim3 COKEO -0.74151 -0.11152 0.06352 COKEX 1.05930 0.15932 -0.09074 DIETCO 0.78369 -0.13768 -0.17552 DIETCX -0.78369 0.13768 0.17552 DIETPO 1.14584 0.06555 0.88023 DIETPX -0.35257 -0.02017 -0.27084 DIET7O 1.32920 0.43564 0.67686 DIET7X -0.34461 -0.11294 -0.17548 PEPSIO -0.78660 -0.50534 0.19538 PEPSIX 0.69920 0.44919 -0.17367 SPRITEO -0.55858 1.05603 -0.54943 SPRITEX 0.26715 -0.50506 0.26277 TABO 1.22034 0.00307 -0.28692 TABX -0.58364 -0.00147 0.13722 UP7O -0.70868 1.00532 0.71130 (b-3) Squared Cosines for the Column Points Dim1 Dim2 Dim3 COKEO 0.785480 0.017767 0.005764 COKEX 0.785480 0.017767 0.005764 DIETCO 0.614178 0.018956 0.030806 DIETCX 0.614178 0.018956 0.030806 DIETPO 0.403982 0.001322 0.238401 DIETPX 0.403982 0.001322 0.238401 DIET7O 0.458054 0.049202 0.118777 DIET7X 0.458054 0.049202 0.118777 PEPSIO 0.549993 0.226994 0.033931 PEPSIX 0.549993 0.226994 0.033931 SPRITEO 0.149224 0.533353 0.144376 SPRITEX 0.149224 0.533353 0.144376 TABO 0.712246 0.000005 0.039371 TABX 0.712246 0.000005 0.039371 UP7O 0.180802 0.363844 0.182141 UP7X 0.180802 0.363844 0.182141 ******************************************************************** さて、主成分分析の固有値(a-1)と対応分析の固有値(b-1)の%は一致している 。 それで、主成分負荷量(a-2)は対応分析のなにに対応しているのか。(b-2)は主 軸の得点ですが、主成分負荷量と違っています。(b-3)は平方相関ですが、こ れも数値が違います。しかし、平方しているので、これの平方根を求めます。 たとえば、 0.785480の平方根は 0.88627 と主成分負荷量と一致します。とい う訳で、主成分負荷量は対応分析の平方相関の平方根と一致するのです。 なお、(1)の主成分分析のデータを多重対応分析したときも同じです。 proc corresp dimens=3 mca ; table cokeo -- up7o ; run; ******************************** では、数量化3類はどうなのか。これは、平方相関を求めるという思想を持ち ません。強弁すれば、数量化3類は主成分分析に似ているが、思想が異なって いるといえるでしょう。 なお、homalsと、対応分析と数量化の関係 変数 人 対応分析 主軸 主軸 数量化3類(SPSS) 標準軸 主軸 数量化3類(駒澤) 標準軸/固有値の平方根 標準軸 homals 主軸 標準軸 (なお、対応分析はSASの既定値となっているものを使った場合に出力され るものである) 標準軸(standard axis)は平均0、分散1。 主軸(principal axis)=標準軸×(固有値の平方根) このことから、固有値さえわかれば相互に変換可能です。 香川大学経済学部 堀 啓造 hori (at) ec.kagawa-u.ac.jp
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。