[fpr 2915] 2種類の判別関数

Junji Kishimoto

岸本＠東大医学部です。

堀さんの投稿に関連して思い出したのですが、等分散共分散行列で
等事前確率の判別関数は世間で2種類紹介されているので混乱しやすい
ですね。

ｘ：これから分類したい個体の測定値ベクトル
μi：i番目の群の平均値ベクトル
Σ：(共通と仮定した)群内分散共分散行列

として

ｆi(ｘ) ＝ μi'Σ**(-1)ｘ － 0.5μi'Σ**(-1)μi

というのが線形判別関数で、群ごとにこれを計算して最大の群に
属すると判定する、というのが英語の教科書によく出てくる式で、
SASもこれを採用しています。

ところが2群の判別問題に限ると、

ｗ(ｘ) ＝ ｆ1(ｘ) － ｆ2(ｘ)

という形にして、ｗ(ｘ)の正負で判定するということもできます。
日本語の教科書ではこちらの式がよく出てきます。しかし後の式だと
3群以上の判別問題のときに困るし、ベイズ規則へ一般化するのも
難しいので好ましくないと思います。


もうひとつ、クロスバリデーション(交差妥当化？)の件ですが、
世間でクロスバリデーションといえば、

１．データをランダムに２つに分割する
２．一方の群で判別ルールを作り、他方に適用する
    楽観バイアスのない誤判別率が得られる
３．２群の役割を逆転させて、再度評価を行う

というのが普通だと思います。なぜかSASでは(堀さんの話では
SPSSも) Leave-One-Out法のことを指しています。名前だけの問題
ですけど。


岸本 淳司
東京大学 大学院 医学系研究科
クリニカルバイオインフォマティクス

スレッド表示著者別表示日付順表示トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。