[fpr 1201] 標本分散、不偏分散および標準偏差の呼び方

堀啓造

堀@香川大学経済学部です。

nifty の fdelphi でちょっかいをだしたばっかりにどつぼにはまってしまいました。

標本分散とか不偏分散という言い方があります。
豊田秀樹『調査法講義』朝倉書店(1998) p59-60
服部・海保『Q&A 心理データ解析』福村出版(1996) p34
鈴木義一郎『現代統計学小事典』講談社ブルーバックス(1998) p274
芝・南風原『行動科学における統計解析法』東京大学出版会(1991,1995:3刷) p79
芝ほか編『統計用語辞典』新曜社(1984) p231 この項渡部洋

などでは標本分散を nで割る式、不偏分散を n-1 で割る式になってます。ただし最後の辞
典だけはちょっと微妙。つまりどちらも標本分散だけど、n-1 で割る場合を不偏分散と
いって区別する場合が多いという言い方。

わたしもこちらの使用法なのでそのように答えました。ところが、数学ではn-1 の場合に
標本と使う場合があるとのこと、より広範囲にチェックをかけました。

東京大学教養学部統計学教室編『基礎統計学1 統計学入門』東京大学出版会(1991) p184
では標本分布でどちらいうが、 n-1 のほうをまず第1の定義にもってきます。同時にこれ
を不偏分散ともいってます。

渡部洋『心理・教育のための統計学入門』金子書房(1996) p97
n-1 のほうを「不偏標本分布」といってます。

Wilcox,R.R.(1996) Statistics for the social sciences. Academic Press. p18
Howell,D.C.(1997) Statistical methods for psychology. 4th ed. Duxbury.p45-46
とも
the sample variance で n-1 です。同時に sample standard deviation といってます。


宮埜壽夫『心理学のためのデータ解析法』培風館(1993) p13
ここでは標本分散ということばはないですが、分散でそのまま n-1 のほうです。

田中・垂水『Windows版統計解析ハンドブック 基礎統計』共立出版(1997) p29
標本の分散としてn-1 のほうだけをあげる。

と並べ立てても意味がないかもしれませんが、状況がどうなっているのか、手元にあるも
のを調べてみました。

Hays,W.L.(1988) Statistics. 4th ed. Holt. p203
テキストのなかでは n-1 を標本分散として使っているが、

Incidentally, some modern statistics texts completely abondon the idea of the 
sample variance S^2 as used here, and introduce only the unbiased estimate s^2 as 
the variance of a sample.

という説明がある。続けて

However, this is apt to be confusing in some work, and so we will follow the 
older practice of distinguishing between the sample variance S^2 as a descriptive 
statistics, and s^2 as the unbiased estimate of σ^2.

^2 は上付きの2 を表してます。

まあ、妥当な線かな。

問題1
標本<->母集団の対立がある。それからすると、n,n-1 とも標本に対するものでしかない。
そこで見ようとするのはn の場合はあくまで標本に対するもの。ということで、標本<->不
偏の対立がある。ということで折り合いをつけたのですが、そういうことでいいのでしょ
うか。

問題2
では実際にそれぞれの分散をどう呼ぶのがいいのでしょう。Hay氏のように記述統計という
のがなじみがあるのですが、記述統計の標本分散と長ったらしく呼ぶのだろうか?


問題3
fdelphi で実際に問題になっているのは標準偏差です。日本語では「標本標準偏差」とい
うことばを目にしません。東京大学教養学部統計学教室のテキストの索引にはあがってい
るのですが、本文では続けて書かれていません。でもそう言っている例があるらしいので
これはいいとしてといってもこれはいずれも n-1 の場合です。

 このn-1 の場合の標準偏差は「不偏標準偏差」と言っていいのでしょうか?Hays のテキ
ストにはE(s)<>σ であると言ってます。ただし、n が大きいときはほとんどおなじである
ことも言ってます。分布によりますが、正規分布の場合1/4(n-1)s 多いだけですから、n=6 
で 0.04s とそれほど大きな影響ではなさそうなので無視してもいいのかな。

 いずれにしても、「記述統計の標本分散」に対応する「標準偏差」と「不偏分散」に対
応する「標準偏差」を区別する言い方はあるのでしょうか?





----
堀 啓造(香川大学経済学部)e-mail:  hori (at) ec.kagawa-u.ac.jp
home page http://fourier.ec.kagawa-u.ac.jp/~hori/
電話番号 1998/4/1 から変更 087-832-1894(直通) fax 087-832-1820(事務室)
〒760-8523(これで香川大学経済学部)


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。