[fpr 1179] Power, Effect Size, and S.E.M.

豊田秀樹

豊田@立教大学

"Haebara, T." <haebara (at) educhan.p.u-tokyo.ac.jp> さんは書きました:
>南風原@東大教育心理です。
>
>Toyoda Hideki さんが以下のように書いています:
>
>> 豊田@立教大学です
>> 
>> >> これは(ちょっと大袈裟に)たとえるならウィルスの研究をするのに
>> >> 虫眼鏡しか作れなかったということです.1くらいの差を見るのに,そもそも
>> >> 推定尺度値の信頼区間が8以上あるのでは,どうしようもない.
>
>> 学術誌に掲載された「尺度」ですから,私のような教育実習生を送り出す側
>> の読者が使ってみようと思うでしょう.そのとき,かわいい教え子に数値を
>> 割り振るわけですから,せめて検査を受けた学生の尺度値がきちんと評価で
>> きることが大切です.眼の前の実習生が利用する場合には,この学生の推定
>> 尺度値の信頼区間が(両側の幅を見込んでなお)十分に小さいことが大切
>> です.8.53は広いです.
>
>真の得点の信頼区間の幅は,測定値の(集団での)標準偏差と信頼性によって
>決まるわけですが,いま問題となっている尺度のアルファ係数は実習前が .83
>で実習後が .85 です。これは「どうしようもない」ぐらい低い値でしょうか。

「どうしようもない」くらい,,,といわれると,,けっしてそんなことは
ないです.特に,教育心理学研究のなかに登場する変数バッテリーとの
「相対評価」ではむしろ低い値ではありません.

それは分かっているのですが,尺度の性質はスウリ操作の内部で評価されては
いけないと思うのです.

コンテクストフリーで高いとか低いとか言えないのは,つい最近FPRで話題に
成ったばかりです.大切なことは何かに照らして高いか低いかということです.
具体的にどういうことかといいますと,実習にいってもそうは効力感は増えないとい
う心理学的事実がまずあって,そこに焦点をあてて,要請にてらして(この学生
は実習に行って,はたして平均的な変化と比べて自信がついたのか?という要請
にてらして)尺度を提案し,論文を書いているのですから,それと比較して実習前後で
使えるほどの精度の尺度を提案しないといけないと思うのです.

逆の例をあげますと,小生が自分のゼミ生に体験させる抑鬱検査は
項目数が少なく,信頼性の推定値は0.73です.
項目内容は,たとえば「自分は死んだほうがいいとおもう」
などというのがあります(項目をみて笑う学生もいます).
たぶん床面効果の高いことが原因で信頼性が低くなっているのでしょうが
わたしは,(1)結果として数パーセントの人だけが相談所に行く,
(2)入学時に何千人という人がめんどうくさがらずにできる,という現実的な
要請にてらして良い検査であると思います.

--
----------------------------------------------------------------------
TOYODA Hideki Ph.D., Associate Professor,     Department of Sociology
TEL +81-3-39852323 FAX +81-3-3985-2833,   Rikkyo(St.Paul's)University
toyoda (at) rikkyo.ac.jp 3-34-1 Nishi-Ikebukuro Toshima-ku Tokyo 171 Japan
----------------------------------------------------------------------

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。