狩野@筑波大学です In message <199701250852.RAA02884 (at) serv.u-netsurf.or.jp> "[fpr 588] Re: 議論のきっかけ" "stok (at) nkrstat.dp.u-netsurf.or.jp" wrote. stok> stok> stok> 共分散構造分析モデルのfprにおける皆さんの議論展開を楽しみにしていま stok> す.実際に使ってみると,すぐにいくつかの議論を指摘したくなる手法ですが , stok> そのうち1つだけ,初めて使ったときのユーザーの「感想」を書いてみたいと stok> 思います(といってもその後不勉強で進展なしですが,今のうちに初歩問題を ・ stok> ・・). stok> stok> 私と周辺の人々が共分散構造分析を質問紙調査データに適用しはじめたのは , stok> 明白に,豊田『SASによる・』の出版と,豊田他『原因を・』の,あまりの分か stok> りやすさが原因です.そしてその全ての人が最初に適合度基準に関する,あの stok> 有名な「GFI>0.9」に苦しみました(豊田基準と呼んでみます). ご指摘のとおりで,豊田氏の書物は完成度が高く非常に分かり易く書けていますね. 感心するばかりです. 「GFI>0.9」について.この手のものは理論的根拠が導けなく経験に頼ることになる のでしょうか.しかし,この基準は,国際的にもこの線で落ち着いているようです. 「GFI<0.9」の論文はあまり見たことありません.ただ,観測変量が多すぎると話は 別ですが. stok> そこで,LM検定やワルド検定でモデル模索(?)をした結果,ほとんど常に stok> GFIと引き換えに観測変数の個数が少なくなることに不満を持ちました.ちょ stok> うど因子分析で,同じデータなのに,主成分法の回転解はそこそこきれいな単 stok> 純構造が得られ変数が分類されるのに,最小2乗法や最尤法の回転解ではいく stok> つかの観測変数が外れる事態にも似ています(これは良い発見なのですが). stok> せっかく調査した変数を,ほとんど豊田基準を達成するためだけに,説明か stok> ら除外するのは忍びないというわけです.そこでどうやってあきらめたかとい stok> うと,多くの調査が探索的段階で実施され,仮説を発見したい意図で作られて stok> いるからだ,ということにしました(実際,多くの企業の調査がそうです). stok> 共分散構造分析は探索的なデータ解析法ではないとの判断です. stok> stok> ところが,いくつかの事例を拝見すると,うまいテクニック(?)が使われ stok> ています.質問紙調査で多くの項目を測定しておきながら,共分散構造分析モ stok> デルでは,項目群の合計点などの「合成変数」を「観測変数」とするのです. stok> アルバクルがAMOSのデモで使ったマーケティング調査データの事例もそうでし stok> た.こうなると測定項目を捨てずにすみます.しかも期せずして,質的変数が stok> 量的変数のようにもなります(期しているのかな?). stok> しかし合成変数は潜在変数ではないのか?.インチキ臭い気がしてシラケま stok> した.でも,そうやって皆さんは切り抜けているのでしょうか?.相関の高い stok> 変数群の合計点や第1主成分を「観測変数」としていいのなら,上の問題はほ stok> とんどの場合に解決できます.もともと抽象的な質問文を合成して,抽象的な stok> 観測変数名をつけて,その観測変数を説明する因子(潜在変数)には,一段と stok> 抽象化された名前(概念)を構成することになる.それでもリアリティーのあ stok> りそうな調査もあります(イメージ調査など). stok> 小笠原春彦(1990)「共分散潜在構造モデル」は,これに関連して「その変数 stok> が,観測される変数だけの関数であらわすように方程式を操作することができ stok> ない時にその変数を潜在変数と呼ぶ」(ベントラー(1982))を引用し,「主 stok> 成分や正準変量は,...潜在変数ではない」と述べました.興味をそそるの stok> ですが善悪は語っていません. stok> こうなると,主成分分析や正準分析は共分散構造分析の予備解析に使うこと stok> になるかも・・・.こういう探索的アプローチは共分散構造分析の精神に反す stok> る? Dr Arbuckle のセミナーでは,Churchill-Surprenant(1982, JMR pp491-504) の論文 で扱われている顧客満足度に関する解析例を,彼が作った共分散構造分析ソフトウェ アである AMOS を使って分析して見せていました.簡単に言えば,「顧客満足度」は ,「パフォーマンス」と「期待度」の差に関連してくるよ,という話でした. 質問項目は具体的には報告されていないのですが,(video disk player の)満足度(潜 在変数;構成概念)の指標は次のようにして構成されています.(video disk player の)個々の機能について賛成か反対かを 7-point Likert scale で問う.全部で10項 目.また,個々の機能について好きか嫌いかを 7-point Likert scale で問う.これ も全部で10項目.「賛成か反対か」の項目を合計して顕在変数』である「満足度1 」を構成する;「好きか嫌いか」の項目を合計して顕在変数』である「満足度2」を 構成する.そして,「満足度1」と「満足度2」を潜在変数「満足度」の指標としま す.[実際には,全体的満足度2項目,購買可能性1項目を加えて合計5項目が満足度 の指標] これが,鈴木さんのおっしゃる「合成変数を作成する」という方法です. 「合成変数を作成し共分散構造分析にかける」ことは,ごく普通に行われており,以 下のような特徴が考えられます. i) 適合度が上がる ii) 項目を削るより合成変数を作る方が情報の損失が少ない. iii) 順序離散変数データが連続変数データに近づく iv) 尺度構成からの説明 i) 適合度が上がる 20項目を1つの因子「満足度」で説明しても,当てはまりが悪いことが予想されま すね.それを,2項目にまとめると,少なくとも数理的には2項目ー1因子モデルは 完全にデータにフィットします(識別可能ではないが).これが,鈴木さんのいう「イ ンチキ臭い気がしてシラケました」という感じを生むのは,私も同じです. 例えば,10項目を主成分分析すれば,第2第3主成分もかなり大きくなり,10項 目の1次元性はないことが多いと思います.しかし,第1主成分が「満足度1」を表 しており,第2主成分以降の変動は第1主成分には現れてきません.つまり,10項 目を第1主成分にまとめるということは,「満足度1」を含めた多次元的な様相をも つ10項目から,我々が興味のある「満足度1」という変動のみを取り出す作業であ ると解釈できます.データの取り方から考えて第1主成分負荷量はほぼ等しいことが 多いので,単なる合計得点で代用する.また,主成分分析の代わりに因子分析を行な っても近い結論になります. ここでは,20項目を10項目*2としたわけですが,どのように分けるか,いくつ に分けるかも問題になってきます.指標の数は2〜4あたりが目安でしょう.3変量 1因子モデルは,飽和モデルです.つまり,3指標にするとモデルのフィットに関し てはこの部分の悪さは出てきません.一方,4指標だとこの部分から自由度2の悪さ が出てきます.一方,2指標だと自由度1あまり,その他の部分のフィットに貢献で きます. この例では,賛成か反対かの10項目は「beleif(信念)」を,「好きか嫌いか」の10 項目は「affect(感情)」を表しています.これに購買の可能性「action(行動)」を加 えれば,いわゆる,態度(attitude)の3要素ですよね.この質問紙作成の背景には, 「満足度」を念頭においた video disk player への態度の測定があると思います. ii) 項目を削るより合成変数を作る方が情報の損失が少ない. 20項目が1因子モデルにしたがっているという理想的な状態で,(a) 20項目全部 を用いる full model,(b) この20項目からいくつかの項目を削除する marginal model,そして,(c) 合成変量を作成する averaging model の3つのモデルを考えま す.一般にこれらのモデルによる統計的推測の良さは,次のような順になります. full model >= averaging model > marginal model 20項目が1因子モデルにしたがっているという条件ですから,full model が一番良 いのは当然です.実は,full model と averaging model のパフォーマンスはかなり 近く,因子負荷量が等しければ(平行テストなど.より正確には独自分散が等しいこ と)これら2つのパフォーマンスは一致します. 以上の結果から,(a) marginal model を使う意義はなく,(b) たとえ20項目全部が 1元性を保っていても,無理して20変数の因子分析をする必要はない,ことが分か ります.(もちろんモデルに合っていない変量は取り除く必要があります) iii) 順序離散変数データが連続変数データに近づく 以前は,一つの正規乱数発生法として,独立な6つの一様乱数を平均するという方法 がありました.もちろん基礎になる理論は中心極限定理です.共分散構造分析での観 測変量は独立ではありませんが,そのいくつかを平均することにより,分布形が正規 分布に近づくことが期待され,統計解析がし易くなります.これも合成変量を作る, 一つのメリットです. iv) 尺度構成からの説明 合成変量を作るということは,上記の例では,「顧客満足度」に対する尺度構成をし ていることになります.この項については,どなたかのご意見や補足をお願いします . ====================================================================== 狩野 裕 (筑波大学数学系) Phone&Fax: 0298-53-4229(DI) address: 〒305 つくば市天王台1-1-1 Fax: 0298-53-6501(Department) e-mail: kano (at) math.tsukuba.ac.jp ======================================================================
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。