> Date: Mon, 27 Oct 1997 17:39:15 > To:fpr (at) nuis.ac.jp > From:Yasuo Miyazaki <miyazak1 (at) pilot.msu.edu> > Subject:Re: [fpr 814] Re: sampling error > > ミシガン州立大学大学院の宮崎です。 > > 溝口さん@NTTのいわれた、”ーーーしかし、世帯視聴率のデータは、サイコロを振 る試行のように、 > 一定の生起確率を仮定するーーー”ことがまさに単純任意標本抽出(Simple Random Sampling without replacement)という標本抽出のデザインによって実現されているわけです。なぜかと いうと、まず、N個のユニット(視聴率の問題の場合は世帯)からなる母集団を考え 、今我々の興味をもっている変数をyとします。そのN個のユニットのyの値をy1 、y2、..、yi、..,yN(これらは固定された値であり確率変数ではないことに注意 して下さい)とします。視聴r率の問題の場合は、 > > yi= 1 if 母集団のi番目の世帯がその番組を見た、 > 0 if ーーーーーーーーーーーーーーー見なかった > > となります。今N世帯のうち a 世帯がその番組をみたとすれば 母平均である a/N が我々の知りたい母集団の視聴率であるわけで、これを pとおきます。この pを n 個の無作為の標本(無作為ということが決定的に大事で無作為でない標本に対しては これから述べるような”一定の生起確率”を想定することはできません。n個のサン プル Y1、Y2、。。。、Ynはサンプルであるゆえランダム変数(確率変数)であり、 j 番目の標本のyの値 Yj(j = 1,2,...,n)に関して 1になる確率が p、0になる 確率が 1-p という確率分布は単純任意標本抽出という 標本抽出のデザインによって決められてくるわけです。さらには、この標本抽出のデ ザインとそれから想定されるYjの確率分布によって標本平均(サンプルから得られ た視聴率)が母平均(母集団における視聴率)の不偏推定値となっている性質やその 分散、95%信頼区間などの式も決まってきます。 > > > なお、確率変数Y(Y=Y1+Y2+ーーーー+Yn)はベルヌーイ確率変数Y1、 。。、Ynが独立な場合のみ2項分布を確率分布としてもちますが、有限母集団から の非復元単純任意標本抽出では正確には2項分布とはなりません。もちろん、n/N <<1の場合(視聴率調査の場合はたぶんこうだと思います。)または復元をする任 意標本抽出の場合にはYは2項分布となります。 > 宮崎康夫 > > > Yasuo Miyazaki MQM miyazak1 (at) pilot.msu.edu
ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。