[fpr 271] quant 3 etc.

堀啓造

堀 啓造@香川大学経済学部です。

Tokuhisa Suzuki さんは書きました:[fpr 264]

>>>多重対応分析の場合、
>>>大隅昇るほか(1994)記述的多変量解析法 日科技連
>>>p159-160 では「すべての質問が2つの反応カテゴリーからなるときには、
多重解析
>>>は各質問の2つのカテゴリーの中の一つのカテゴリーだけに注目した主成
分分析に
>>>すぎない」ということを証明しています。
>
> 3類は意外に(数理的にも実用的にも)難しく思います.それこそ1週間
ま
>とめて会社を休んで,本と論文とパソコンに向かって勉強したい気持ちです
.
>私は実際に自分でIMLかなんかで書きながらやってみないと理解できないので
>勉強してみますが,ソフトウエアの出力でも確認できますか?,サンプル数
量
>と主成分が同値になるわけですよね.対称行列の特異値分解と,一般のデー
タ
>行列の特異値分解との違い位があるかと想像していました.堀さんの作られ
た
>SPSSの3類マクロの研究成果に期待を寄せています.2値変数の2カテゴリ
の
>扱いの問題は参考書にあまり詳しく書いてないように思いますが,数年前に
西
>里先生が行動計量学で論文を書いていた記憶があります.

これは読んでいません。SASが動いたので、数値的に確認しました。長いで
すが、サンプルプログラムとともに結果の見方を同封します。

2値型データの対応分析と主成分分析
2値型データを主成分分析をしてみる。
データはHoffman,D.L. and Franke,G.R. 1986 Correspondence analysis: 
Graphical representation of categorical data in marketing research. 
Journal of Marketing Research, 23(Aug),213-27. also in P.E.Green et 
al.(1989) Multidimensional Scaling. Allyn and Bacon.のソフトドリンクを
この1週間の購入と消費。
 
(1)データの主成分分析。(SAS)
data soft8;
  input num cokeo  dietco  dietpo  diet7o
            pepsio spriteo  tabo up7o
  ;
  cards;
 1 1 0 0 0 1 1 0 1
 2 1 0 0 0 1 0 0 0
 3 1 0 0 0 1 0 0 0
 4 0 1 0 1 0 0 1 0
 5 1 0 0 0 1 0 0 0
 6 1 0 0 0 1 1 0 0
 7 0 1 1 1 0 0 1 0
 8 1 1 0 0 1 1 0 1
 9 1 1 0 0 0 1 1 1
10 1 0 0 0 1 0 0 1
11 1 0 0 0 1 1 0 0
12 0 1 0 0 0 0 1 0
13 0 0 1 1 0 1 0 1
14 1 0 0 0 0 1 0 0
15 0 1 1 0 0 0 1 0
16 0 0 0 0 1 1 0 0
17 0 1 0 0 0 1 0 0
18 1 1 0 0 1 0 0 0
19 1 0 0 0 0 0 0 1
20 1 1 1 0 1 0 0 0
21 1 0 0 0 1 0 0 0
22 1 0 0 0 1 0 0 0
23 0 1 0 1 0 0 1 0
24 1 1 0 0 1 0 0 0
25 0 1 1 1 0 0 0 0
26 0 1 0 1 0 0 1 0
27 0 1 0 0 0 0 1 0
28 1 0 0 0 0 1 0 1
29 1 0 0 0 0 1 0 0
30 0 1 1 0 0 0 1 0
31 1 0 0 0 1 0 0 1
32 0 1 1 0 0 0 1 0
33 1 0 0 0 1 0 0 1
34 0 1 1 1 0 0 1 0
;
proc factor nfact=3 data=soft8 preplot ;
  var cokeo -- up7o;
run;

(2)対応分析の場合、これに飲まなかった場合の該当、非該当を入れて列が倍
になる。
data soft;
  input num cokeo cokex dietco dietcx dietpo dietpx diet7o diet7x
            pepsio pepsix spriteo spritex tabo tabx up7o up7x
  ;
  cards;
 1 1 0 0 1 0 1 0 1 1 0 1 0 0 1 1 0
 (中略)
 proc corresp dimens=3;
  var  cokeo -- up7x ;
run;

(a)主成分分析(3因子にしているのは元の論文が3因子のため)
(a-1)
      Eigenvalues of the Correlation Matrix:  Total = 8  Average = 1

                              1           2           3           4
       Eigenvalue        3.8540      1.2114      0.7936      0.7095
       Difference        2.6425      0.4179      0.0841      0.1023
       Proportion        0.4817      0.1514      0.0992      0.0887
       Cumulative        0.4817      0.6332      0.7324      0.8211

(a-2)
Initial Factor Method: Principal Components

                              Factor Pattern

                             FACTOR1   FACTOR2   FACTOR3

                  COKEO     -0.88627  -0.13329   0.07592
                  DIETCO     0.78369  -0.13768  -0.17552
                  DIETPO     0.63560   0.03636   0.48826
                  DIET7O     0.67680   0.22182   0.34464
                  PEPSIO    -0.74162  -0.47644   0.18420
                  SPRITEO   -0.38630   0.73031  -0.37997
                  TABO       0.84395   0.00213  -0.19842
                  UP7O      -0.42521   0.60319   0.42678

                     Variance explained by each factor

                         FACTOR1   FACTOR2   FACTOR3
                        3.853960  1.211443  0.793567

(b)対応分析
(b-1)
                   Inertia and Chi-Square Decomposition

     Singular  Principal Chi-
     Values    Inertias  Squares Percents   10   20   30   40   50
                                         ----+----+----+----+----+---
     0.69408   0.48174   131.035  48.17% ************************
     0.38914   0.15143    41.189  15.14% ********
     0.31495   0.09920    26.981   9.92% *****
     0.29780   0.08869    24.122   8.87% ****
     0.27550   0.07590    20.645   7.59% ****
     0.22158   0.04910    13.355   4.91% **
     0.17410   0.03031     8.245   3.03% **
     0.15374   0.02363     6.429   2.36% *
               -------   -------
               1.00000       272 (Degrees of Freedom = 495)

(b-2)
                            Column Coordinates

                              Dim1          Dim2          Dim3

             COKEO        -0.74151      -0.11152       0.06352
             COKEX         1.05930       0.15932      -0.09074
             DIETCO        0.78369      -0.13768      -0.17552
             DIETCX       -0.78369       0.13768       0.17552
             DIETPO        1.14584       0.06555       0.88023
             DIETPX       -0.35257      -0.02017      -0.27084
             DIET7O        1.32920       0.43564       0.67686
             DIET7X       -0.34461      -0.11294      -0.17548
             PEPSIO       -0.78660      -0.50534       0.19538
             PEPSIX        0.69920       0.44919      -0.17367
             SPRITEO      -0.55858       1.05603      -0.54943
             SPRITEX       0.26715      -0.50506       0.26277
             TABO          1.22034       0.00307      -0.28692
             TABX         -0.58364      -0.00147       0.13722
             UP7O         -0.70868       1.00532       0.71130

(b-3)  
                   Squared Cosines for the Column Points

                              Dim1          Dim2          Dim3

             COKEO        0.785480      0.017767      0.005764
             COKEX        0.785480      0.017767      0.005764
             DIETCO       0.614178      0.018956      0.030806
             DIETCX       0.614178      0.018956      0.030806
             DIETPO       0.403982      0.001322      0.238401
             DIETPX       0.403982      0.001322      0.238401
             DIET7O       0.458054      0.049202      0.118777
             DIET7X       0.458054      0.049202      0.118777
             PEPSIO       0.549993      0.226994      0.033931
             PEPSIX       0.549993      0.226994      0.033931
             SPRITEO      0.149224      0.533353      0.144376
             SPRITEX      0.149224      0.533353      0.144376
             TABO         0.712246      0.000005      0.039371
             TABX         0.712246      0.000005      0.039371
             UP7O         0.180802      0.363844      0.182141
             UP7X         0.180802      0.363844      0.182141

********************************************************************
さて、主成分分析の固有値(a-1)と対応分析の固有値(b-1)の%は一致している
。
それで、主成分負荷量(a-2)は対応分析のなにに対応しているのか。(b-2)は主
軸の得点ですが、主成分負荷量と違っています。(b-3)は平方相関ですが、こ
れも数値が違います。しかし、平方しているので、これの平方根を求めます。
たとえば、 0.785480の平方根は 0.88627 と主成分負荷量と一致します。とい
う訳で、主成分負荷量は対応分析の平方相関の平方根と一致するのです。

なお、(1)の主成分分析のデータを多重対応分析したときも同じです。
proc corresp dimens=3 mca ;
 table cokeo -- up7o ;
run;
********************************
では、数量化3類はどうなのか。これは、平方相関を求めるという思想を持ち
ません。強弁すれば、数量化3類は主成分分析に似ているが、思想が異なって
いるといえるでしょう。

なお、homalsと、対応分析と数量化の関係
              変数               人
対応分析          主軸               主軸
数量化3類(SPSS)  標準軸               主軸
数量化3類(駒澤)    標準軸/固有値の平方根      標準軸
homals           主軸              標準軸
(なお、対応分析はSASの既定値となっているものを使った場合に出力され
るものである)


標準軸(standard axis)は平均0、分散1。
主軸(principal axis)=標準軸×(固有値の平方根)
このことから、固有値さえわかれば相互に変換可能です。
 

香川大学経済学部
        堀 啓造
hori (at) ec.kagawa-u.ac.jp

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。