[fpr 2252] 「傾向差」は統計用語?

堀啓造

堀@香川大学経済学部です。

Re: [fpr 2248] Re: 「傾向差」は統計用語?

 湯浅さんwrote

 
> 僕の好きなEBM(evidence based medicene)を他人に教えるときは、有意差
を見るよ
> り、まずデザインをしっかりと吟味して、症例数や効果の差の大きさそのも
のが臨床
> 的に意味があるかを考えてから、最後に有意差があるかをチェックするよう
にしてい
> ます。

効果の大きさには言及していませんが,前に紹介した[fpr 2212] The lady 
tasting tea (David Salsburg (著))
http://www.nuis.ac.jp/~mat/fpr/fpr2002/0088.html

この問題を2章に渡って扱ってます。1章は
[fpr 2215] EBM実践のための統計学的Q&A
http://www.nuis.ac.jp/~mat/fpr/fpr2002/0091.html
で言及したところです。要するに因果関係の検証になるのかどうかの問題。
18章 Does smoking cause cancer?
です。ここでは前には触れなかったのですが,疫学のほうからは何度も同じ結
果がでたなら検証したことになるのではないかとか,いくつかの議論をしてま
す。例えば,社会学からは共変数をとってその影響を除いて分析する。SPSSな
んかでは当たり前となっている方法など。Fisher は前にいったようにそんな
んじゃダメだランダム化しろということです。もちろんこの論争は今でも続い
ているということも言ってます。


もう1章が17章 The intent to treat です。こっちは医療現場からの問題提
起をどう受け止めるかです。Petoの1980年代前期の提起というかアプローチに
対する諸見解。ランダム化できないときどうするの。Cox, Box, Deming, 
Cochran, Rubin の見解・アプローチが紹介されてます。

この本ではp値についてもおもしろい話があります。
仮説検定の5%についてNeymanは提案したけど,自分では積極的には使わな
かった。Fisher はご存知のように,p値そのものを使うという立場ですね。彼
の本にはp=0.001のときにあきらかに差があるというような言い方をしている
がいくらだったらいいとかの発言は全くない。

信頼区間についてNeymanは提案したがそのときはそのときの確率は何を意味し
ているかは明確でなかった。後にきっちりいっている。提案したときにその問
題を討論者はしっかり指摘していた。

Neymanの論文は非常にわかりやすくその論理について行くのは容易であるとし
ています。

逆にFisher は難しい。Fisher にとって明らかなことも,他人には明らかでな
いことが多い。例えば,Fisher の本 Statisitical methods for research 
worker は応用の仕方は書いてあるが,数学的証明はない。そこを梅田のが
Cramer のMathematical metods of statistics(1945) である。Cramer は隔離
状態だったのでその間にしこしこやったということ。ところが,1970年代に
Yale大学の人がFisher の論文(おそらく本)をチェックしたところ,まだ証
明できていない問題が複数あったとのこと。

Fisher の能力は眼が悪くて,夜の明かりの下では本を読むなと医者にいわれ
たことによって鍛えられた。パブリックスクール時代に家庭教師に数学を教え
てもらっていたが,テキストなしでやった。(ノートもなしなのか)。それで
幾何学的直観が発達したといっているが,代数的直観というか自動計算も発達
したのでは。

大学生のときには,Student の論文の問題を指摘し,Biometrikaに発表してい
る。その後の論文をPearsonが理解できずに,長い間放置し自分で理解できる
形(数表だったか)にして初めてPearsonの論文の付録として載せた。これで
Fisher はPearsonに大して怒り,Biometrika に投稿しないばかりか,息子の
Peasonにまで嫌っていた。

歴史ものを読めば載っている話もあるかもしれませんが,なかなか面白いし,
それぞれのアプローチの重要性もわかるものになってます。

これを読む限り,とりあえずFisher のラインで理解し,その派生や異なる論
理として統計学説史を理解すればいいのかなと思えます。ま,Fisher をどう
理解するかはかなり難儀しそうですが。

また,この本は次のように喝破している。(おっと。みんな認めていたら喝破
とはいえないか)
,
Karl Pearsonの考えが20世紀科学の根底をなしている。つまり,
すべての観測は確率分布から起こっている。科学の目的はその分布のパラメー
タを推定することことである。p291)

(Fisher はデータとパラメータの関係をPeasonよりもシビアに考えている。
p64-67 Fisher の考えだとデータから推論したパラメータも分布である。と
いうことは,母集団全体をとって推測しても母集団そのもののthe パラメータ
とはいえない。ということは,……となりますね。)

つまりニュートン物理学のような因果関係の世界ではなく,確率分布の世界に
なったのである。

そのパラメータとは平均,標準偏差,歪度(本ではsymmetory),尖度(おお
い,atokにはないぞ。今まで登録していないのがおかしいのか)。p16

そしてそのためのデータやパラメータを記録するのがBiometrikaだったそう
だ。この本では従来よりもK.Pearsonを高く評価していると言っています。

索引もいいし,文献案内もいい。お薦めの本です。

ところで,Karl PearsonのKarl はどうしてついた。この本によるとCarl だっ
たのが,ドイツ留学中にMarx に心酔し,名前を変えたそうです。

硬軟両方とも面白い。」

日本人は一人だけ載っています。Kahenman, Tversky  にも言及しています。
また,1章が短いので,つまらないところも簡単に行きすぎます。訳本で読め
るといいね。もっとも英語は平易なので高卒レベルで大丈夫じゃないかな。

少し真面目に紹介しました。


----
堀 啓造(香川大学経済学部)
home page http://www.ec.kagawa-u.ac.jp/~hori/
電話番号 087-832-1894(直通) 
     fax 087-832-1820(事務室)
〒760-8523(これで香川大学経済学部)
    香川県高松市幸町2−1 香川大学経済学部

スレッド表示 著者別表示 日付順表示 トップページ

ここは心理学研究の基礎メーリングリストに投稿された過去の記事を掲載しているページです。