岡本@金沢大学です。
[fpr 1051]より:
>抽出可能なすべてのサンプル、つまりすべての組み合わせに
>ついて不偏推定値を計算
>し、(例えば、母集団 N=5 で n=3 のサンプルの抽出の仕方は
> 5C3=10
>通り)それらの平均値を取ると、母集団の真の値と一致します。
>このことを、小さな
>データで実際に計算することが、結構 n-1
>の役割を実感できるのではないかと思います。
上の考え方が間違っていることは、豊田秀樹(1998)「調査法講義」
の15.1.2節「不偏分散」において示されています。
実際に計算してみますと以下のようになります。
例えば、母集団が
1.0 2.0 3.0 4.0 5.0
の5つの要素からなる場合に、サンプル数3のデータ10通りについて
計算してみます。
この場合、母集団の分散は
2.00000000000000E+0000
です。
サンプルの分散、不偏分散は
分散 不偏分散
1 1 1 0 0 0.66667 1.00000
1 1 0 1 0 1.55556 2.33333
1 0 1 1 0 1.55556 2.33333
0 1 1 1 0 0.66667 1.00000
0 1 1 0 1 1.55556 2.33333
1 0 1 0 1 2.66667 4.00000
1 1 0 0 1 2.88889 4.33333
1 0 0 1 1 2.88889 4.33333
0 1 0 1 1 1.55556 2.33333
0 0 1 1 1 0.66667 1.00000
となります。
上の表において、例えば
1 1 1 0 0
は、1,2,3番目の要素をサンプルとし、4,5番目の
ものはサンプルには含まれない場合を示します。
上の平均をとると
分散の場合 1.66667
不偏分散の場合 2.50000
となり、不偏分散の平均2.5は母集団の分散2.0とはことなります。
上の計算を行ったプログラムは後でホームページ
http://www.users.kudpc.kyoto-u.ac.jp/~e50048/page2/
に上げておきます。
ご確認下さい。
岡本 安晴
c00279 (at) simail.ne.jp
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。