[fpr 258] 不適解

狩野裕

狩野@つくば大学です(出身は大阪です)

昨日のメイルを出した後で、このメイリングリストの LOG を取り寄せて見ましたと
ころ、難しい議論が延々と続いていて、勉強にはなるものの、やはり、あのような
メイルは出さないほうがよかったと、少し後悔しました。

しかしながら、また出してしまうというところが、email の恐いところでしょうか、
魅力なのでしょうか?


> 豊田@教育心理学専攻です

> >シミュレーションをやるとすぐにわかるのですが、シミュレーシ
> >ョンは、真のモデルが因子モデルであり、それから発生させた乱数に基づいて因子分
> >析をするのですから、不適解の原因は標本変動のみです。私の感じでは、12変量*
> >3因子*標本サイズ100だと、10%以上が不適解になるのではないかと思われま
> >す(勿論モデルの真値によりますが)。
> 
> その真値でありますが,大学院生のとき行ったシミュレーションでは,共通性
> の値を高くセットすると「良性」の不適解がたくさん観察されました.考えてみれば
> 統計量は真値のまわりにばらつくのですから,真値が0.3の場合と0.95の場合を比較
> すれば,後者の推定値が1.0を突破する確率が高くなるのが自然です.統計学的
> にはそれで良いのでしょうが,心理学の立場からは少々パラドクス的です.
> 一般的に,プサイは測定誤差分散と独自因子分散の和と考えられ,項目作製段階
> ではワーディングに気を配り,信頼性が高くなるように,他の項目との構成概念妥当
> 性が高くなるように配慮し,共通性を高めようと努力しているからです.心理学の技
> 術的な現状では信頼性や妥当性をそれ程高くできないから,この問題は表面化しない
> のかもしれません.

不適解になるかどうかという点で、モデルの信頼性(?)を測るときは、このような
結論ですね。真値が 0.3 の場合と0.95 の場合を比較するとき、一般に、推定値の標準
誤差は、0.3 の場合のほうが大きくなると思います。ある意味で、\Lambda の部分が
弱いと、\Psi は不安定になり、漸近分散(標準誤差)が大きくなるからです。このよう
に考えると、そのパラドックスは解消しませんか?


> >良性の不適解に対しては、「独自性が非負である」という制約のもとで推定値を求めた
> >り(ほとんどのソフトウェアはデフォルトでそうなっているはず)、
> 
> 本当ですか?
> ほとんどのソフトはデフォルトでは,制約していないとおもいますが?
> また,節度というか「たしなみ」というか,デフォルトで制約してはいけな
> いと思います.不適解はモデルとデータの適合の重要なサインですから.

豊田さんのほうがソフトウェアに詳しいからそうなんでしょうし、この意見に私は
賛成です。一方、ソフトウェアの製作者が制約をつけたがる気持ちもよ分かるよう
な気がしますが。

> 
> >ペナルティ法やベイズ法が有効な推定法になると考えます。
> 
> 不適解が観察されたときに,それをペナルティ法やベイズ法で回避することは,数理
> 統計学的にはなんら問題ないと思いますが,実用場面では心理学的に問題があると思
> います.というのは「使用した関数または事前分布は『せっかく苦労してあつめたデ
> ータなんやから,不適解なんかになられたらウチ困る.ぎょうさん研究費つこたんや
> から,共通性の大きさをちょっと勉強して(まけて)えな』という信念を表現してい
> るのでしょう」と指摘されたら(それが本音なので)抗弁できないからです.


なかなか、いい口調でんな。すっきゃなあ〜。

%これで、私の出身がバレバレ! 
メイルだと、標準語を喋る紳士と思ってくれないかという淡い期待は。。。(関東へ
出てきて2年。学生は、放言にいや方言に未だ戸惑っています。)


>>このように、初期値によって解が大きく変わる、不適解になる変数が変わる、という
>>ことになると、このモデルは信用がおけないのではないかという気になってきます。
>>この2つの解にバリマックス回転などを施そうものなら、まったく違った回転解が得
>>られるものと思われます。
>
>この部分は実践家にとって有用なノウハウですね.私も経験的に感じて,無意識に
>利用していた判断基準でしたが,「初期値によって解が著しく異なる場合は悪性で
>ある」ことは理論的に示されるのでしょうか.というより推定値がズルズル移動
>する症状を伴うことが多くて,識別問題に引っ掛かっている可能性が高いという
>ことなのでしょうか

私の印象はそうです。不適解の多くは識別可能でないことから引き起こされていると
思います。


> 私は,拙著でも述べているように,不適解に出会ったら「独自性の絶対値」に注目しま


名著「SASによる。。。」だと思いますが、どの辺りに書いてあるか教えてくださ
い。一度、不適解の処理法についてまとめてみたいな、とも考えていますので。



> す.その値が今回のように,大きい場合には「悪性」と判断します.あるいは「良性」
> かもしれないけれども標本数が少なすぎて実質科学的な解釈はできない状態と判断しま
> す.この判断基準は明快です.絶対値が小さい場合は,独自分散の信頼区間をにらんで,
> その変数の常識的な信頼性と妥当性の観点から「良性」と仮定して矛盾がないかどうか
> 判断します.

独自分散の信頼区間を見ることは重要ですね。同感、同感。悪性だと、独自分散と
因子負荷量の間に不定性が生まれ、両者の信頼区間が他と比べて大きくなります。
従って、因子負荷量の方も情報をもっていることがあります。

この不定性がFisher 行列を特異に近づけ、漸近分散を大きくし、信頼区間を大きく
するのです。

> 処理をどうするかという問題ですが,
> 1.信頼区間と比較して絶対値が小さい
> 2.変数の信頼性も高いし,構成概念妥当性もあるから「良性」の可能性が高い.
> という説明を加えて,そのまま発表しても良いし,バウンズを設けて独自性
> を0として発表してもよいと思います.それが実態に近い結果だからです.
> データを構造と誤差に分けたときに,構造の部分が大きいからこそ起きた
> 不適解なので,堂々と発表してよいと思います.
> 	

不適解が良性であることを立証したときは、不適解である解析結果を発表しても
受け入れてくれる土壌(or journal)が欲しいと思います。


=================================================================
狩野  裕 (筑波大学数学系)        Phone: 0298-53-4229(DI)
e-mail: kano (at) math.tsukuba.ac.jp     Fax : 0298-53-6501
=================================================================






スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。