[fpr 602] Observed Power

堀啓造

堀@香川大学経済学部です。

Kano Yutaka <kano (at) math.tsukuba.ac.jp> さんは書きました:[fpr 589] 

>Continuous univariate distributions vol.2 (Wiley; Johnson, Kotz, 
>Balalrishnan 2nd ed; 1995; page 495) に,非心F分布の非心パラメータの
推定問
>題が議論されています.
>
>先に述べた,
>(i)              nc^=[{(df2-2)/df2}*f_obs-1]*df1
>は,一様最小分散不偏推定量として紹介されています.ただ,nc^<0 となる
可能性が
>あるため,
>(i)+             nc+^=nc^   if nc^>0
>                 nc+^=0     otherwise
>なる推定量が提案されている,とあります.しかし,nc+^ は(解析的でない


(a)O'Brien,R.G. and Muller,K.E.(1993) Unified power analysis for 
t-test through mulitvariate hypotheses. in L.K.Edwards(ed.)"Applied 
analysis of variance in behavioral science". Dekker. p309 (8.19)

でも同じでした。

南風原さんからいただいた、Thomas,L(1997)では、observed effect sizeと
observed variance を使っての検定力の推定は意味がないと強くいってますが
、効果量については、否定していないようです。観測効果量の信頼区間を求め
るほうは有効性を認めています。

SPSS(など)の既成統計パッケージの問題は、
(1)observed effect size と variance を使って、
(2)不偏推定量ではない、観測検定力(こういっていいのか?)を求めている
2つの点にあります。
さらに個人的に追加すれば
(3)不偏推定量でない効果量を求めている。

(2)だけでもまったく話しにならないということでしょう。(1)の点からも
power に関してはほとんど意味がないでしょう。

(3)の効果量が不偏推定量ならば、次の実験・調査や今後の人たちにも役に立
つでしょう。事実文献(a)では予備調査のときには不偏推定量を使うといって
います。

ともって回って、不偏推定効果量の問題にもっていきます。

(1)O'Brien はλ^adjust つまり不偏推定λから不偏推定効果量を求めます。

                   SS hyp                 SS hyp
             λ =---------------x dfe =-----------
                    SS eror                MSE error

      λadj=max(0,((λ*(dfe-2)/dfe-1)*dfh))    

            fadj=sqrt(λadj/N)    N= サンプル数



(2)KirkやWinerは別の方法から不偏推定効果量を求めます。
この(1)と(2)が一致しない。

一元分散分析です。
                          
            f^ = sqrt(dfh/N*(MSBG-MSWG)/MSWG)      MSBG=群間平均平方和 
                                                   MSWG=群内平均平方和
           

 α     mswg   msbg  group N
---------------------------------    
 0.05  49.00  61.00    4 32
 0.50  42.86  64.00    2 16
 0.05  2.179  16.333   4 32
 0.05  25.348 162.563  2 16
 0.05 150.458 1104.750 4 16
 0.05  49.00  61.00    4 40
 0.05  49.00  61.00    4 60
 0.05  49.00  61.00    4 120
--------------------------------
というデータを分析してみました。
結果

                                                      (1)   (2)
    lambda    lambda  power  adjusted        f  adjusted     Kirk
            unbiased            power   effect         f        f
                                          size

      3.73       .47   .296      .075      .34       .12      .15
      1.49       .28   .734      .556      .31       .13      .18
     22.49     17.88   .972      .926      .84       .75      .78
      6.41      4.50   .654      .506      .63       .53      .58
     22.03     15.36   .930      .805     1.17       .98     1.09
      3.73       .53   .304      .079      .31       .11      .14
      3.73       .60   .315      .085      .25       .10      .11
      3.73       .67   .326      .091      .18       .07      .08

(1)がλadj から求めた効果量、(2)がKirkらの式から求めた不偏効果量(1)の
列と(2)の列では明らかに違ってきている。どちらの推定のほうがいいのだろ
うか。まあ、このあたりからも推定区間を求めるべきなのだろうが、業界にお
いて、まずこのレベルのなんらかのコンセンサスがないと困る。            


Kirk,R.E.(1995) Experimenta design. 3rd ed. Brooks.
Winer,B.J.,Brown,D.R., and Michels,K.M.(1991) Statisticaal principles 
in experimental design. 3rd ed. McGraw-Hill.

上の結果を求めたSPSSマクロ。baseだけで動きます。

title "power analysis for two tailed f-test".
*  effect size index f=.
* small f=.10 : medium f=.25: large f=.40  Cohen(1988).

data list free/ alpha mswg msbg  groups   n .

begin data
 0.05  49.00  61.00    4 32
 0.50  42.86  64.00    2 16
 0.05  2.179  16.333   4 32
 0.05  25.348 162.563  2 16
 0.05 150.458 1104.750 4 16
 0.05  49.00  61.00    4 40
 0.05  49.00  61.00    4 60
 0.05  49.00  61.00    4 120
end data.

*initialize values.
compute dfh=groups-1.
compute lambda=(groups-1)*msbg/mswg.
compute f=sqrt(lambda/n).
compute dfe=n-groups.
compute f_alpha=idf.f(1-alpha,dfh,dfe).
compute powa=1-ncdf.f(f_alpha,dfh,dfe,lambda).
* adjusted lambda.
compute   lambda2=lambda*(dfe-2)/dfe-dfh.
if (lambda2 < 0) lambda2=0.
compute power2=1-ncdf.f(f_alpha,dfh,dfe,lambda2).
compute esize=sqrt(lambda2/n).
compute esize2=sqrt(dfh*(msbg-mswg)/n/mswg).
format  powa power2 alpha (f5.3).
report format=list/var= 
       lambda 'lambda'
       lambda2 'lambda' 'unbiased'
       powa 'power'
       power2 'adjusted' 'power'
       f 'f' 'effect' 'size'
        esize 'adjusted' 'f' 
       esize2 'Kirk' 'f'

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。