[fpr 628] bootstrap in SEM

繁桝算男
繁桝(東大、総合文化)です.

このところのfprの充実ぶりはすごいですね.私も、コメンターを引き受けた以上、
少なくともフォロウはしていたいところなのでひとこと.

SEMと因果関係に関しては、若干の悲観論が多いようで、それは無理もないところ
なのでしょうが、その点で私の疑問を提示します.(私のといっても良くある
議論ですが).

狩野さん紹介の歌ではありませんが、気楽にパスを引いて、SIGMA＝SIGMA(THETA)で
共分散行列を表現し、これをH０とする.H０が採択されれば、因果関係は証明された
とする立場について考察する.(この素朴な立場をそのまま信ずる人は余りいない
とは思いますが)

１.H０を採択されたとしても、積極的にH０を採択すべきだという根拠にはならない.
２.しかも、上記１に関わらず、データの数が多いとほぼ確実にH０は棄却される.
３.古典的な検定のルールは、データを見る前にたくさんの可能なデータを鳥瞰して、
ルールをつくり、実際のデータに適用するからこそ、確率的言明が意味をもつと
思いますが、SEMの場合、データを見てモデルを精錬することが多く、P値等の意味が
なくなる.

さて、それではというわけで、記述的発想により、適合度指標が０.９以上と
いうような親指ルールが使われる.(親指ルールって知っていますか？
rule of thumbの直訳らしい.STATISTICAの翻訳にこう出ていました.英語に
翻訳できる人は良いけど、知らない人はどう見たでしょうね.)これに対して、

１.この指標は、非正規性、カテゴリー化、少数サンプル、データの再表現等に
影響されやすい.
この指摘は、Hoyle(Eds)の第４章からの受け売りですが、私のゼミで岩沢さんと
いう人が、項目単位で分析した場合のGFI０.６５が、尺度化によって、０.９１にまで
上昇していました.こういうことってあるのですか？また、ADF推定法を使うと、
０.９９７となって、これも驚き.
しかし、このことは、本質的な問題ではなく、真の問題は、０.９とか、
RMSEAなら、０.０５以下というようなルールが可能なのかということだと思います.
(ちなみに、この問題は、RMSEAの標本分布が求まるということとは別問題).

私はこれは本質的には無理であり、複数のモデルの比較的検討のみが可能なのでは
ないかと思います.
批判するのはやさしいがということなのですが、我々が試みているのは、データという
証拠にてらして、各モデルを真とする確率あるいは比を計算するというものです.
(何という単純さ！)そんなことが可能か？ギブスサンプリングによって可能となります.
現に、BICは、この確率のラフな近似としての意味をもちます.(今統計学では、
この近似をラプラス近似で改善することが流行っているようですが)

SEMに関しては、分からないことのみ多く、上記のようなことは既に議論が
終わっていることなのかも知れません.ところで、
BICが出て来たところで、鈴木さんのamusingなコメントに蛇足.

(１)AIC、BICがあって、CDがなくて...ということですが、Bozdoganの指標は、CICと
いわなかったですか？もっともCALISでしらべたら、CAICとなっていた.
(２)Screeというと、カリフォルニアのハゲ山の麓に風化した岩石が堆積しているのを
思い出します.日本の山では、考えにくい？
(３)御安心下さい.t分布の由来を知らないのはあなただけではありません.
わたしも、F分布のFは、FisherのFといった後に詰まるのがtです.蓑谷さんの本と
Johnson,Kotzの本を調べても出ていませんでした.どなたか教えて下さい.
スレッド表示著者別表示日付順表示トップページ
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。