[fpr 1052] 標準偏差についての質問

岡本安晴

岡本@金沢大学です。

  [fpr 1051]より:

>抽出可能なすべてのサンプル、つまりすべての組み合わせに
>ついて不偏推定値を計算
>し、(例えば、母集団 N=5 で n=3 のサンプルの抽出の仕方は
> 5C3=10
>通り)それらの平均値を取ると、母集団の真の値と一致します。
>このことを、小さな
>データで実際に計算することが、結構 n-1
>の役割を実感できるのではないかと思います。


  上の考え方が間違っていることは、豊田秀樹(1998)「調査法講義」
の15.1.2節「不偏分散」において示されています。

  実際に計算してみますと以下のようになります。

  例えば、母集団が

      1.0    2.0   3.0   4.0   5.0

の5つの要素からなる場合に、サンプル数3のデータ10通りについて
計算してみます。

  この場合、母集団の分散は

       2.00000000000000E+0000

です。

  サンプルの分散、不偏分散は

                     分散         不偏分散
  1  1  1  0  0     0.66667        1.00000
  1  1  0  1  0     1.55556        2.33333
  1  0  1  1  0     1.55556        2.33333
  0  1  1  1  0     0.66667        1.00000
  0  1  1  0  1     1.55556        2.33333
  1  0  1  0  1     2.66667        4.00000
  1  1  0  0  1     2.88889        4.33333
  1  0  0  1  1     2.88889        4.33333
  0  1  0  1  1     1.55556        2.33333
  0  0  1  1  1     0.66667        1.00000

となります。

  上の表において、例えば

   1   1   1   0   0

は、1,2,3番目の要素をサンプルとし、4,5番目の
ものはサンプルには含まれない場合を示します。

  上の平均をとると

     分散の場合       1.66667

     不偏分散の場合   2.50000

となり、不偏分散の平均2.5は母集団の分散2.0とはことなります。

  上の計算を行ったプログラムは後でホームページ

   http://www.users.kudpc.kyoto-u.ac.jp/~e50048/page2/

に上げておきます。

  ご確認下さい。

                                      岡本 安晴
                                      c00279 (at) simail.ne.jp


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。