[fpr 2915] 2種類の判別関数

Junji Kishimoto

岸本@東大医学部です。

堀さんの投稿に関連して思い出したのですが、等分散共分散行列で
等事前確率の判別関数は世間で2種類紹介されているので混乱しやすい
ですね。

x:これから分類したい個体の測定値ベクトル
μi:i番目の群の平均値ベクトル
Σ:(共通と仮定した)群内分散共分散行列

として

fi(x) = μi'Σ**(-1)x − 0.5μi'Σ**(-1)μi

というのが線形判別関数で、群ごとにこれを計算して最大の群に
属すると判定する、というのが英語の教科書によく出てくる式で、
SASもこれを採用しています。

ところが2群の判別問題に限ると、

w(x) = f1(x) − f2(x)

という形にして、w(x)の正負で判定するということもできます。
日本語の教科書ではこちらの式がよく出てきます。しかし後の式だと
3群以上の判別問題のときに困るし、ベイズ規則へ一般化するのも
難しいので好ましくないと思います。


もうひとつ、クロスバリデーション(交差妥当化?)の件ですが、
世間でクロスバリデーションといえば、

1.データをランダムに2つに分割する
2.一方の群で判別ルールを作り、他方に適用する
    楽観バイアスのない誤判別率が得られる
3.2群の役割を逆転させて、再度評価を行う

というのが普通だと思います。なぜかSASでは(堀さんの話では
SPSSも) Leave-One-Out法のことを指しています。名前だけの問題
ですけど。


岸本 淳司
東京大学 大学院 医学系研究科
クリニカルバイオインフォマティクス


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。