堀@香川大学経済学部です。 nifty の fdelphi でちょっかいをだしたばっかりにどつぼにはまってしまいました。 標本分散とか不偏分散という言い方があります。 豊田秀樹『調査法講義』朝倉書店(1998) p59-60 服部・海保『Q&A 心理データ解析』福村出版(1996) p34 鈴木義一郎『現代統計学小事典』講談社ブルーバックス(1998) p274 芝・南風原『行動科学における統計解析法』東京大学出版会(1991,1995:3刷) p79 芝ほか編『統計用語辞典』新曜社(1984) p231 この項渡部洋 などでは標本分散を nで割る式、不偏分散を n-1 で割る式になってます。ただし最後の辞 典だけはちょっと微妙。つまりどちらも標本分散だけど、n-1 で割る場合を不偏分散と いって区別する場合が多いという言い方。 わたしもこちらの使用法なのでそのように答えました。ところが、数学ではn-1 の場合に 標本と使う場合があるとのこと、より広範囲にチェックをかけました。 東京大学教養学部統計学教室編『基礎統計学1 統計学入門』東京大学出版会(1991) p184 では標本分布でどちらいうが、 n-1 のほうをまず第1の定義にもってきます。同時にこれ を不偏分散ともいってます。 渡部洋『心理・教育のための統計学入門』金子書房(1996) p97 n-1 のほうを「不偏標本分布」といってます。 Wilcox,R.R.(1996) Statistics for the social sciences. Academic Press. p18 Howell,D.C.(1997) Statistical methods for psychology. 4th ed. Duxbury.p45-46 とも the sample variance で n-1 です。同時に sample standard deviation といってます。 宮埜壽夫『心理学のためのデータ解析法』培風館(1993) p13 ここでは標本分散ということばはないですが、分散でそのまま n-1 のほうです。 田中・垂水『Windows版統計解析ハンドブック 基礎統計』共立出版(1997) p29 標本の分散としてn-1 のほうだけをあげる。 と並べ立てても意味がないかもしれませんが、状況がどうなっているのか、手元にあるも のを調べてみました。 Hays,W.L.(1988) Statistics. 4th ed. Holt. p203 テキストのなかでは n-1 を標本分散として使っているが、 Incidentally, some modern statistics texts completely abondon the idea of the sample variance S^2 as used here, and introduce only the unbiased estimate s^2 as the variance of a sample. という説明がある。続けて However, this is apt to be confusing in some work, and so we will follow the older practice of distinguishing between the sample variance S^2 as a descriptive statistics, and s^2 as the unbiased estimate of σ^2. ^2 は上付きの2 を表してます。 まあ、妥当な線かな。 問題1 標本<->母集団の対立がある。それからすると、n,n-1 とも標本に対するものでしかない。 そこで見ようとするのはn の場合はあくまで標本に対するもの。ということで、標本<->不 偏の対立がある。ということで折り合いをつけたのですが、そういうことでいいのでしょ うか。 問題2 では実際にそれぞれの分散をどう呼ぶのがいいのでしょう。Hay氏のように記述統計という のがなじみがあるのですが、記述統計の標本分散と長ったらしく呼ぶのだろうか? 問題3 fdelphi で実際に問題になっているのは標準偏差です。日本語では「標本標準偏差」とい うことばを目にしません。東京大学教養学部統計学教室のテキストの索引にはあがってい るのですが、本文では続けて書かれていません。でもそう言っている例があるらしいので これはいいとしてといってもこれはいずれも n-1 の場合です。 このn-1 の場合の標準偏差は「不偏標準偏差」と言っていいのでしょうか?Hays のテキ ストにはE(s)<>σ であると言ってます。ただし、n が大きいときはほとんどおなじである ことも言ってます。分布によりますが、正規分布の場合1/4(n-1)s 多いだけですから、n=6 で 0.04s とそれほど大きな影響ではなさそうなので無視してもいいのかな。 いずれにしても、「記述統計の標本分散」に対応する「標準偏差」と「不偏分散」に対 応する「標準偏差」を区別する言い方はあるのでしょうか? ---- 堀 啓造(香川大学経済学部)e-mail: hori (at) ec.kagawa-u.ac.jp home page http://fourier.ec.kagawa-u.ac.jp/~hori/ 電話番号 1998/4/1 から変更 087-832-1894(直通) fax 087-832-1820(事務室) 〒760-8523(これで香川大学経済学部)
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。