[fpr 815] sampling error

Yasuo Miyazaki

ミシガン州立大学大学院の宮崎です。

溝口さん@NTTのいわれた、”ーーーしかし、世帯視聴率のデータは、サイコロを振
る試行のように、
一定の生起確率を仮定するーーー”ことがまさに単純任意標本抽出(Simple Random
Sampling without
replacement)という標本抽出のデザインによって実現されているわけです。なぜかと
いうと、まず、N個のユニット(視聴率の問題の場合は世帯)からなる母集団を考え
、今我々の興味をもっている変数をyとします。そのN個のユニットのyの値をy1
、y2、..、yi、..,yN(これらは固定された値であり確率変数ではないことに注意
して下さい)とします。視聴r率の問題の場合は、

                     yi= 1 if 母集団のi番目の世帯がその番組を見た、
                        0 if  ーーーーーーーーーーーーーーー見なかった

となります。今N世帯のうち a 世帯がその番組をみたとすれば 母平均である a/N
が我々の知りたい母集団の視聴率であるわけで、これを pとおきます。この pを n
個の無作為の標本(無作為ということが決定的に大事で無作為でない標本に対しては
これから述べるような”一定の生起確率”を想定することはできません。n個のサン
プル
Y1、Y2、。。。、Ynはサンプルであるゆえランダム変数(確率変数)であり、
j 番目の標本のyの値 Yj(j = 1,2,...,n)に関して 1になる確率が
p、0になる 確率が 1-p という確率分布は単純任意標本抽出という
標本抽出のデザインによって決められてくるわけです。さらには、この標本抽出のデ
ザインとそれから想定されるYjの確率分布によって標本平均(サンプルから得られ
た視聴率)が母平均(母集団における視聴率)の不偏推定値となっている性質やその
分散、95%信頼区間などの式も決まってきます。


なお、確率変数Y(Y=Y1+Y2+ーーーー+Yn)はベルヌーイ確率変数Y1、
。。、Ynが独立な場合のみ2項分布を確率分布としてもちますが、有限母集団から
の非復元単純任意標本抽出では正確には2項分布とはなりません。もちろん、n/N
<<1の場合(視聴率調査の場合はたぶんこうだと思います。)または復元をする任
意標本抽出の場合にはYは2項分布となります。 
                                                                        宮崎
康夫                            

 
Yasuo Miyazaki
MQM
miyazak1 (at) pilot.msu.edu


スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。