[fpr 1011] 外れ値の処理について

高橋知音

高橋知音@信州大です。
コメントに対するコメントです。

豊田先生、博士論文に関する励ましありがとうございました。現在9月提出にむけて
データ収集中なのですが、反応時間の議論がもりあがっていたのでつい発言してしま
いました。

外れ値の扱いは難しいですね。私は指導教官の指示と業界(?)の「しきたり」にした
がって被験者ごとに2SDで削除という方法でやっていますが、たしかにこれには明確
な根拠があるわけではなく、基準を3SDにするなど除去するデータの数によって結果
が違ってきます。結局のところ結果が望ましい方向にでるように意図的に操作するこ
とを避けるための便宜的なものという感じでしょうか。このあいまいさを排除して、
かつ外れ値の影響を減らしたいというのであれば、さまざまな変換を行う必要がある
のでしょう。

これもまた業界のしきたりに従って、分散分析では被験者と刺激語をランダム変数と
してそれぞれ別にFを求めていますが、厳密には同時に考慮する必要がありますよね
。しかしこれでは基準が厳しすぎるということで別々に求めるようになったのだと指
導教官に言われました。

ちなみに、刺激語をランダム変数として分析する際には、被験者ごとに2SDの外れ値
を削除するのと同様に刺激語ごとに2SDの外れ値を削除する必要があるのではと考え
たのですが、それはだれもやってないようです。ためしに一度やってみたことがある
のですが、これは結果として全体に反応が極端に遅い被験者のデータを集中的に削除
する結果になったりしました。もしかしたら、こういった被験者は課題に対して、こ
ちらが意図したことと全く異なる処理をやっているのかもしれません。そういったマ
イノリティをおかしいものとして排除するか、それも含めて心理的現実としてとらえ
ていくのかは研究の目的にもよるのかなと思います。もし前者であれば刺激語ごとに
2SDで削除するという手続きもまんざら無意味ではないという気がするのですがいか
がでしょうか。


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。