[fpr 3401] カテゴリカルデータ分析(catdap)について

Nozomi Nakashima

はじめまして。
中島@岡山県立大学大学院生と申します。
 
現在、ある目的変数に対し、最も関連の強い複数の説明変数の組み合わせを探るべく、
堀先生がSPSSマクロに移植された「CATDAP2(4元クロス表まで)script」を使用させて
いただいてお
ります。
(堀先生には、このマクロを作成・公表していただいたことに対し、この場を借りてお
礼申し上げま
す。)
fprの皆様にご意見・ご教示いただきたいことがございまして、投稿致しました。
 
今行っている分析は、「どのような生活ストレスが、その人の精神的健康を大きく左右
するものであ
るか」を検討するもので、
反応変数に精神的健康(「1:健康群」「2:不健康群」と二値に変換したもの)、
説明変数に「相談できる人がいないので悲しい」など、生活ストレスに関する24項目(
回答は四件法
)を入れて行っております。
分析した結果、様々な組み合わせでのクロス表・AICの出力があり、結果が解釈しやす
い、という印
象を持ちました。
私的には、納得のゆく(ある程度予想していた)結果であったと思います。
 
CATDAPを使用した理由は、以前当プログラムを使用したことのある先生に勧められ、
坂元先生の『カテゴリカルデータのモデル分析』(1985)を拝見し、
「説明変数の最適な組み合わせ・区分法を探索するために開発したフォートラン・プロ
グラムである
。」
「予測の有効性は説明変数の組み合わせばかりでなく、その変数のカテゴリーの区分法
にも依存する
。・・・(中略)・・・
予測の有効性の観点からみれば、有効性が最大となるようなカテゴリーの区分法を各変
数(の組み合わせ)について求め、
そのときの情報量を比較するのでなければ比較に恣意がはいり公平でないとの見方も成
り立つであろう。」
という記述をみたからです。
 
今使用させていただいているcatdap2マクロは、4次元クロス表まで分析してくれるソフ
トであり、
説明変数の最適なカテゴリー化・また(説明変数として)連続変量を入れた分析はでき
ないと考えています。
このような認識で間違っていないでしょうか。
 
今回の分析ではそもそも連続変量は含まれていませんし、カテゴリー数も少ないので
最適なカテゴリー化云々はそれほど問題になりませんが、
今後、もし説明変数に連続変量も加えて「説明変数の最適な組み合わせ・区分法を探索
」したいとき、
どのようにしたら良いのでしょうか。やはり、統計数理研究所などに
CATDAP-02プログラムの提供を願い出るほか方法は無いのでしょうか。

CATDAPについては、書籍・論文などで偶に紹介されておりますが、
具体的な使用方法まで書かれたものはほぼ無い状態で(私が調べた範囲でですが)
Internetで検索してみても、情報は限られています。
 
私は統計に関してはほぼ初心者の状態で、自分の認識・解釈について正しいのかどうか
、さえも実際よく分かっておりません。
拙い文章を長々と、また質問自体がとても失礼なことかもしれませんが、
この中に間違っている認識などありましたら、もしよろしければ、ご指摘いただきたけ
ればと思いま
す。
また、連続変量などの最適なカテゴリー化についての方法・参考資料についてご教示い
ただければ幸
いです。
 
よろしくお願い致します。


---------------------------------------------------------
  岡山県立大学大学院保健福祉学研究科
  中島 望
  E-mail: n2178nakashima (at) nifty.com
---------------------------------------------------------



スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。